objective-c - C语言或OC或C++ 中英文混合的文件读取前3个字符怎么做？

Question

1.txt 文件内容： 你好a,我是千叶！ 期望结果： 你好a {代码...} ==================================================================================== 我的场景是文件比较大，不太想把整个文件读取到NSData...

天蓬老师 · Answer

提供個思路：

讀取文件，你必須知道字元編碼
產生NSString 對象，NSString 有個初始化方法是initWithData:encoding:，然後 NSData 有個初始化方法是dataWithContentsOfFile:
確保步軸2 正常產生物件後，呼叫 NSString 的成員方法：substringWithRange:進行截取

希望能幫到lz

ringa_lee · Answer

問題的重點在於：ANSI 編碼的條件下，一個漢字佔兩個位元組，一個英文字元佔一個位元組。

那麼對於你說的例子：

// 1.txt
你好a,我是千叶！
^^^^^
// "你好a", 数一数，是5个字节。

所以如果你想截取"你好a", 那麼使用：

cfread(x,sizeof(char),5,fp);
printf("%s
", x); // 输出 "你好a"

如果全是中文，例如：

// 1.txt
你好啊,我是千叶！
^^^^^^
// 三个汉字是 6 个字节

那你如果想要漢字不被截斷，至少應該讀取偶數個位元組。

cfread(x,sizeof(char),6,fp);
printf("%s
", x); // 输出 "你好啊"

伊谢尔伦 · Answer

這個得看編碼。如果編碼標準不確定，恐怕什麼軟體都會讀出亂碼來。

PHP中文网 · Answer

...不確定跟你說的是不是一個東西...
無非是中文字元的問題，你直接取前6個字元的長度（不管中英文，6個字元總夠了），轉換成NSString，再直接substringToIndex:3一下，取前三個字，不就出來了嗎？