一区二区三区在线-一区二区三区亚洲视频-一区二区三区亚洲-一区二区三区午夜-一区二区三区四区在线视频-一区二区三区四区在线免费观看

服務(wù)器之家:專注于服務(wù)器技術(shù)及軟件下載分享
分類導(dǎo)航

PHP教程|ASP.NET教程|Java教程|ASP教程|編程技術(shù)|正則表達式|C/C++|IOS|C#|Swift|Android|VB|R語言|JavaScript|易語言|vb.net|

服務(wù)器之家 - 編程語言 - C/C++ - C++中漢字字符串的截取

C++中漢字字符串的截取

2020-11-23 14:34C++教程網(wǎng) C/C++

C++中漢字字符串的截取,需要的朋友可以參考一下

1、

復(fù)制代碼 代碼如下:

const char *str = "test測試test";
while(*str)
{
//這里只需要判斷第一個字節(jié)大于0x80就行了,前提是輸入的是合法的GBK字符串
//原因在于,如果第一個字節(jié)大于0x80,那么它必然和后面一個字節(jié)一起組成一個漢字
//所以就沒有必要再去判斷后面一個字節(jié)了
//再強調(diào)一下,前提條件是輸入合法的GBK字符串
if(*str > 0x80)
{
// 漢字,計數(shù)器++
str += 2;//是漢字自然就該直接+2了
}
else
{
str++;
}
}

 

2、

參看下面的字符串轉(zhuǎn)換函數(shù)。

復(fù)制代碼 代碼如下:


/**
* 用getBytes(encoding):返回字符串的一個byte數(shù)組
* 當(dāng)b[0]為 63時,應(yīng)該是轉(zhuǎn)碼錯誤
* A、不亂碼的漢字字符串:
* 1、encoding用GB2312時,每byte是負數(shù);
* 2、encoding用ISO8859_1時,b[i]全是63。

 

* B、亂碼的漢字字符串:
* 1、encoding用ISO8859_1時,每byte也是負數(shù);
* 2、encoding用GB2312時,b[i]大部分是63。
* C、英文字符串
* 1、encoding用ISO8859_1和GB2312時,每byte都大于0;
* 總結(jié):給定一個字符串,用getBytes("iso8859_1")
* 1、如果b[i]有63,不用轉(zhuǎn)碼; A-2
* 2、如果b[i]全大于0,那么為英文字符串,不用轉(zhuǎn)碼; B-1
* 3、如果b[i]有小于0的,那么已經(jīng)亂碼,要轉(zhuǎn)碼。 C-1
*/
private static String toGb2312(String str) {
if (str == null) return null;
String retStr = str;
byte b[];
try {
b = str.getBytes("ISO8859_1");

for (int i = 0; i < b.length; i++) {
byte b1 = b[i];
if (b1 == 63)
break; //1
else if (b1 > 0)
continue;//2
else if (b1 < 0) { //不可能為0,0為字符串結(jié)束符
retStr = new String(b, "GB2312");
break;
}
}
} catch (UnsupportedEncodingException e) {
// e.printStackTrace();
}
return retStr;
}

 

 

3、

 

復(fù)制代碼 代碼如下:


unsigned char *str = "test測試test";
int length;
int i;

length = strlen(str);
for (i = 0; i < length - 1; i++)
{
if ( *str >= 0x81 && *str <= 0xFE
&& *(str + 1) >= 0x40 && *(str + 1) <= 0xFE)
{
// 漢字
}
}

unsignedchar*str="test測試test";//把字符串換成“漢A”試試,結(jié)果為2

 

 

 

有人說:“一個GBK漢字要占兩個char空間(二字節(jié)),而且第一個字節(jié)里的值是小于0的。可以據(jù)此判斷是否為漢字。”
1、為什么第一個字節(jié)的值小于0呢?
2、如果僅通過判斷第一個字節(jié)如果小于0,則該字節(jié)和下一個字節(jié)就組成一個漢字,這種邏輯是否保險?
3、因為還看到有人說,GBK編碼的漢字有高位和低位兩位,第一個是低位吧?需要第一個字節(jié)在160-254之間,第二個字節(jié)在64-254之間,這樣是不是比2中提到的方法要保險?
4、如果DB中的字符集是SIMPLIFIED CHINESE_CHINA.ZHS16GBK,這個是GBK字符集?GBK兼容GB2312

似乎有些字符集中有些漢字占三個字節(jié)

“通過判斷第一個字節(jié)如果小于0,則該字節(jié)和下一個字節(jié)就組成一個漢字”

//GBK漢字內(nèi)碼范圍
//81-A0 ,40-7E 80-FE
//AA-AF ,40-7E 80-A0
//B0-D6 ,40-7E 80-FE
//D7 ,40-7E 80-F9
//D8-F7 ,40-7E 80-FE
//F8-FE ,40-7E 80-A0
例如://81-A0 ,40-7E 80-FE
表示字符的ascii碼要在129-160,64-126,128-254這三個區(qū)間段內(nèi)

4、
在工作中,遇到要截取字符串在屏幕上顯示出來,因為字符串帶有漢字,如果截取不好,會引起亂碼,寫了下面的函數(shù)

在uclinux下與VC6.0中測試可以通過。

view plaincopy to clipboardprint?

 

復(fù)制代碼 代碼如下:


 /*截取字符串

 

 name :要截取的字符串

 store:要存儲的字符串

 len:要截取的長度

 */

 void split_name( char * name , char * store , int len )
 {

     int i= 0 ;

     char strTemp[L(NAMEL)]={0};

     if ( strlen(name)
     {

         strcpy( store, name );  *name=0;

         return ;

     }

     //從第1個字節(jié)開始判斷

     while( i < len )

     {

         if ( name[i]>>7&1 && name[i+1]>>7&1 )       //if ( name[i] < 0 && name[i+1] < 0 )

             i = i + 2 ;

         else

             i = i + 1 ;

     }

     i = i > len ? i-3 :i-1;

     strncpy( store , name , i+1 ); //截取前i+1位

     *(store+i+1)=0;

     strcpy( strTemp , name + i + 1 );

     strcpy( name , strTemp );

 }

 

延伸 · 閱讀

精彩推薦
  • C/C++深入理解goto語句的替代實現(xiàn)方式分析

    深入理解goto語句的替代實現(xiàn)方式分析

    本篇文章是對goto語句的替代實現(xiàn)方式進行了詳細的分析介紹,需要的朋友參考下...

    C語言教程網(wǎng)7342020-12-03
  • C/C++c++ 單線程實現(xiàn)同時監(jiān)聽多個端口

    c++ 單線程實現(xiàn)同時監(jiān)聽多個端口

    這篇文章主要介紹了c++ 單線程實現(xiàn)同時監(jiān)聽多個端口的方法,幫助大家更好的理解和學(xué)習(xí)使用c++,感興趣的朋友可以了解下...

    源之緣11542021-10-27
  • C/C++詳解c語言中的 strcpy和strncpy字符串函數(shù)使用

    詳解c語言中的 strcpy和strncpy字符串函數(shù)使用

    strcpy 和strcnpy函數(shù)是字符串復(fù)制函數(shù)。接下來通過本文給大家介紹c語言中的strcpy和strncpy字符串函數(shù)使用,感興趣的朋友跟隨小編要求看看吧...

    spring-go5642021-07-02
  • C/C++學(xué)習(xí)C++編程的必備軟件

    學(xué)習(xí)C++編程的必備軟件

    本文給大家分享的是作者在學(xué)習(xí)使用C++進行編程的時候所用到的一些常用的軟件,這里推薦給大家...

    謝恩銘10102021-05-08
  • C/C++C語言中炫酷的文件操作實例詳解

    C語言中炫酷的文件操作實例詳解

    內(nèi)存中的數(shù)據(jù)都是暫時的,當(dāng)程序結(jié)束時,它們都將丟失,為了永久性的保存大量的數(shù)據(jù),C語言提供了對文件的操作,這篇文章主要給大家介紹了關(guān)于C語言中文件...

    針眼_6702022-01-24
  • C/C++C++之重載 重定義與重寫用法詳解

    C++之重載 重定義與重寫用法詳解

    這篇文章主要介紹了C++之重載 重定義與重寫用法詳解,本篇文章通過簡要的案例,講解了該項技術(shù)的了解與使用,以下就是詳細內(nèi)容,需要的朋友可以參考下...

    青山的青6062022-01-04
  • C/C++C/C++經(jīng)典實例之模擬計算器示例代碼

    C/C++經(jīng)典實例之模擬計算器示例代碼

    最近在看到的一個需求,本以為比較簡單,但花了不少時間,所以下面這篇文章主要給大家介紹了關(guān)于C/C++經(jīng)典實例之模擬計算器的相關(guān)資料,文中通過示...

    jia150610152021-06-07
  • C/C++C語言實現(xiàn)電腦關(guān)機程序

    C語言實現(xiàn)電腦關(guān)機程序

    這篇文章主要為大家詳細介紹了C語言實現(xiàn)電腦關(guān)機程序,文中示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下...

    xiaocaidayong8482021-08-20
主站蜘蛛池模板: 亚洲国产成人久久综合一区77 | sao虎在线精品永久在线 | 全黄h全肉细节文在线观看 全彩成人18h漫画 | 成人精品亚洲人成在线 | 四虎网站网址 | 日本特级a禁片在线播放 | 古装一级毛片 | 海角社区在线登录 | 男人搡女人视频免费看 | 国产在线精品一区二区高清不卡 | 爱福利视频一区 | 日本中文字幕一区二区有码在线 | 欧美日韩亚洲区久久综合 | 国产成人精品午夜视频' | 人人澡人 | 无人影院在线播放视频 | 免费观看一级欧美在线视频 | 日本午夜色 | 成人在线一区二区 | 日本理论片中文在线观看2828 | 99在线精品免费视频九九视 | 污漫日本E同人 | 99这里只有精品在线 | 91在线精品国产 | 1024亚洲精品国产 | 91精品国产色综合久久不卡蜜 | 亚洲欧美一区二区久久 | 亚洲图片综合区 | 日本视频观看 | 日本高清在线看免费观看 | 欧美va在线| 双子母性本能在线 | 手机看片国产自拍 | 国产亚洲精品激情一区二区三区 | 手机看片一区二区 | 黑人群性xxx | 校园全黄h全肉细节文 | daring国家队在线观看樱花动漫 | 国产成人一区二区三区视频免费蜜 | 短篇小说肉 | 亚洲AV无码国产精品色在线看 |