【发布时间】:2017-07-13 15:09:21
【问题描述】:
我有一个看起来像 1,3-5,7,9-11 的字符串,我将通过重复调用 strtok 来标记它,以便输出看起来像:
1
3
5
7
9
11
我的代码如下所示:
#include <stdio.h>
#include <string.h>
void tokenize(char *string){
char *token;
token = strtok (string,"-");
while (token != NULL) {
// ... do some other unrelated stuff ...
printf("\tToken %s\n", token);
token = strtok (NULL, ",");
}
}
int main (int argc,char **argv)
{
char *token;
token = strtok (*(argv+1),",");
while (token != NULL) {
if (strchr(token,45)){ //45 is ASCII for "-".
tokenize(token);
}
printf("Token1 %s \n", token);
token = strtok (NULL, ",");
}
return 0;
}
但是,当我运行代码时,它过早结束,我得到:
./tokenizer 1,3-5,7,9-11
Token1 1
Token 3
Token 5
Token1 3
但我期望/想要类似的东西:
./tokenizer 1,3-5,7,9-11
Token1 1
Token 3
Token 5
Token1 7
Token 9
Token 11
如果我注释掉 tokenize(temptoken); 的行(换句话说,strtok on "," only),那么输出看起来就像人们期望的那样:
./tokenizer 1,3-5,7,9-11
Token1 1
Token1 3-5
Token1 7
Token1 9-11
所以看起来问题确实出在对已经标记化的字符串的后续 strtok 调用上,所以我尝试 memcpy 指向标记指针的内存,但这并没有真正帮助:
#include <stdio.h>
#include <string.h>
void tokenize(char *string){
char *token;
token = strtok (string,"-");
while (token != NULL) {
printf("\tToken %s\n", token);
token = strtok (NULL, ",");
}
}
int main (int argc,char **argv)
{
char *token;
char *temptoken ;
token = strtok (*(argv+1),",");
while (token != NULL) {
if (strchr(token,45)){ //45 is ASCII for "-".
/* added memcpy */ memcpy(temptoken,token,strlen(token)+1);
tokenize(temptoken);
}
printf("Token1 %s \n", token);
token = strtok (NULL, ",");
}
return 0;
}
$ ./tokenizer 1,3-5,7,9-11
Token1 1
Token 3
Token 5
Token1 3-5
关于我可以做些什么来修复代码、了解我的误解所在并获得所需输出的任何想法?
【问题讨论】:
-
you
memcpynowhere ...temptoken是一个未初始化的指针。然后,对于字符串,只需使用strcpy代替(一旦你为你的目标正确分配了内存)。 -
使用
strtok_r,strtok有一个内置的副作用。 -
C++ 程序员不要使用这个愚蠢的
strtok函数。 -
@GlenMacLachlan 这只是标签垃圾邮件。尽管您可以用 C++ 编写这样的代码,但您不应该这样做。 C++ 程序员不会感兴趣。
-
而不是
45和评论,只需使用'-'。