【发布时间】:2012-06-08 10:18:44
【问题描述】:
我正在尝试分解一个尚未明确定义部分的字符串(即使用空格或逗号)
示例字符串:FRPARRGBASD
FR PAR GB ASD 都需要分解以作为单独的实体插入到数据库中。
请问我该怎么办
【问题讨论】:
-
这个标记化的逻辑是什么?为什么不是 FRP A RGBAS D?
-
你不能在不知道模式的情况下分割任何东西。是 2/3/2/3 个字符吗?是否根据内容进行拆分?
-
是否要将文本拆分为 2 个字符 - 3 个字符 - 2 个字符 - 3 个字符等...?
-
我猜第一个token的长度是
floor(sqrt(string_length))-1但是我没有找到下一个token的逻辑。 -
你应该在你的问题中解释分裂背后的逻辑