Win32和VC++中的各种字符和字符串类型

在从c到c++的学习过程中,仅仅了解到stl标准模板库中的string、wstring类型,在学习windows程序开发和MFC框架的时候,了解到了wchar、tchar、LPWSTR、LPCSTR、LPCWSTR、LPTSTR等字符和字符串类型。这里记录一下他们的介绍、用法和相互转换的方法。

首先介绍一下wchar和tchar

wchar

Windows为了消除各编译器的差别,重新定义了一些数据类型,你提到了另外几个类型都是这样。CHAR为单字节字符。还有个WCHAR为Unicode字符,即不论中英文,每个字有两个字节组成。它实际定义在<string.h>里:

 typedef unsigned short wchar_t。

下面再看看TCHAR

如果希望同时为ANSI和Unicode编译的源代码,那就要include <TChar.h>。TCHAR是定义在其中的一个宏,通过你是否定义了_UNICODE宏而定义成char或者wchar_t。如果当前编译方式为ANSI(默认)方式,TCHAR等价于CHAR,如果为Unicode方式,TCHAR等价于WCHAR。

相关用法

wchar_t和tchar都有自己的字符串函数,不能使用strcpy这类ANSI C字符串函数。必须使用wcs前缀的函数,例如wcscpy。为了让编译器识别Unicode字符串,必须以在前面加一个“L”,例如:

wchar_t *szTest=L"This is a Unicode string.";

TCHAR也不能使用ANSI的strXXX函数或者Unicode的wcsXXX函数了,必须使用TChar.h中定义的_tcsXXX函数。另外,为了解决刚才提到带“L”的问题,TChar.h中定义了一个宏:“_TEXT”。

 以strcpy函数为例子,总结一下:
 .如果你想使用ANSI字符串,那么请使用这一套写法:

 char szString[100];
 strcpy(szString,"test");

 .如果你想使用Unicode字符串,那么请使用这一套:

 wchar_t szString[100];
 wcscpyszString,L"test");

 .如果你想通过定义_UNICODE宏,而编译ANSI或者Unicode字符串代码:

 TCHAR szString[100];
 _tcscpy(szString,_TEXT("test"));

LPWSTR、LPCSTR、LPCWSTR、LPTSTR

LPCSTR是一个指向以’\0’结尾的常量字符的指针。

LPWSTR是一个指向wchar_t字符串的字符指针。

LPCWSTR是一个指向unicode编码字符串的32位指针,所指向字符串是wchar型,而不是char型。它的声明如下:

typedef const wchar_t* LPCWSTR;

LPSTR是一个指向以NULL(‘\0’)结尾的32位ANSI字符数组指针,LPWSTR是一个指向以NULL结尾的64位双字节字符数组指针。都是以零结尾的字符串指针,相当于CHAR *

这些类型的来源都是缩写:
L来自long,指长的;
P是pointer,代表指针;
LP:长指针(long pointer),这是为了兼容Windows 3.1等16位操作系统遗留下来的,在win32中以及其他的32位操作系统中,long指针和near指针及far修饰符都是为了兼容的作用,没有实际意义。即win32中,long,near,far指针与普通指针没有区别,LP与P是等效的;
T:win32环境中有一个_T宏,用来标识字符是否采用Unicode编码(两字节表示一个字符),若程序中定义了Unicode,该字符/字符串被作为Unicode字符串,否则就是标准的ANSI(单字节表示一个字符)字符串。
C的话是const,说明是个常量;
W就是wide char(wchar),指的是宽字符;
STR顾名思义,就是string字符串啦!

这些字母互相组合,就构成了这些字符串数据类型,可以根据需要来选用。

相互转换

cstring 转换为 *
/* cstring 转 string */
CString cs(_T("cs")); 
string s; 
s = (LPCSTR)(CStringA)(cs); 
/* CString转换成LPCWSTR、LPWSTR、LPCSTR、LPSTR */
//VS2005中CString已经改为宽字符型
LPWSTR lpstr = (LPWSTR)(LPCWSTR)str; 
LPCSTR lpcstr = (LPCSTR)(LPCWSTR)str; 
LPSTR lpcstr = (LPSTR)(LPCWSTR)str; 
/* CString转换成char* 、TCHAR* */
char* p = (char*)str.GetBuffer(); //方法1
char* p = (LPSTR)(LPCTSTR)str; //方法2
TCHAR* pw = str.GetBuffer();
string 转换为 *
/* string 转 cstring */
string s ="Hello World!中国"; //方法1 
CString cs(s.c_str()); //方法2,用c_str()确实比data()要好 CString.format(”%s”, string.c_str());
/* string 转 lpcstr */
std::string a="abc";
LPCSTR str = a.c_str();
/* string转换为LPWSTR */
wstring widstr<em>; 
std:string s("DanTeng");
widstr = std::wstring(s.begin(), s.end());
lvItem.pszText=(LPWSTR)widstr.c_str();
/* string转换为int、float */
//可以使用atoi,atof,atol等函数来完成。
LPCWSTR 转换为 *
/* LPCWSTR转换成CString */
LPCWSTR lpcwStr = L"TestWStr"; 
CString str(lpcwStr);
LPWSTR 转换为 *
/* LPWSTR 转换成LPWSTR */ 
LPWSTR lpwstr = (LPCSTR)lpstr; 
lpwstr = (LPWSTR)lpcstr;
LPCSTR 转换为 *
/* LPCSTR 转换成CString */
LPCSTR lpcStr = (LPCSTR)str; 
/* LPWSTR 转换成LPWSTR */
LPWSTR lpwstr = (LPCSTR)lpstr;
LPSTR 转换为 *
/* LPSTR 转换成CString */
LPSTR lpStr = L"TestStr"; 
CString str(lpStr); 
/* LPSTR 转换成LPCSTR、LPWSTR 、LPCWSTR */
LPCSTR lpcstr = lpstr; 
LPWSTR lpwstr = (LPWSTR)lpstr; 
LPCWSTR lpcwstr = (LPCWSTR)lpstr;
char* 转换为 *
/* char* 转换成CString */
char* p = "test"; //方法1 
CString str = ("%s",p); //方法2
CString.format(”%s”, char*); 
/* char* 转换成string*/
string s(char *); //只能初始化,非初始化的地方还是用assign().
/* char* 转换成LPSTR、LPCSTR */
char *p; 
LPSTR lpstr = p; 
LPCSTR lpcstr = p; 
/* char* 转换成WCHAR */
wchar_t ws[100]; 
swprintf(ws, 100, L"%hs", "ansi string");

/* char* 转换成LPCWSTR */
参考:C++中char*转换为LPCWSTR的解决方案

TCHAR * /WCHAR* 转换为 *
/* TCHAR* 转换成char* */
p = (char*)sex; 
/* WCHAR* 转换成TCHAR* */
pw = (WCHAR*)name; 
/* WCHAR* 转换成char* */
char output[256]; 
WCHAR* wc = L"Hellow World"; 
sprintf(output, "%ws", wc );

在当前版本LPCSTR和LPSTR没区别,即。
LPCSTR, A 32-bit pointer to a constant character string.   
常量指针,一般用于参数传递和固定字符串   
LPSTR, A 32-bit pointer to a character string.   
普通指针,一般用于字符串操作   
根据DBCS或Unicode 自动选择char或wchar_t类型,由定义的宏_UNICODE决定   
LPCTSTR, A 32-bit pointer to a constant character string that is portable for Unicode and DBCS.   
LPTSTR, A 32-bit pointer to a character string that is portable for Unicode and DBCS.

一个转换CString 的例子。

CString str = "ABC";
LPCTSTR ptr1 = new TCHAR[str.GetLength()+1];
ptr1 = (LPCTSTR) str.GetBuffer();
LPTSTR ptr2 = new TCHAR[str.GetLength()+1];
ptr2 = (LPTSTR) str.GetBuffer();
LPSTR ptr3 = new char[str.GetLength()+1];
ptr3 = (LPSTR) str.GetBuffer();
LPCSTR ptr4 = new char[str.GetLength()+1];
ptr4 = (LPCSTR) str.GetBuffer();

另外,要注意选用的函数也要和string类型一致。比如下面:tmp1=144,tmp2=1,因为sLastChan为宽字节,存储为310034003400, atoi函数遇到第一个”00″就会结束。

CString sLastChan = _T("144");
int t,tmp2;
t=_tstoi((TCHAR*)sLastChan.GetBuffer(sLastChan.GetLength()));
tmp2=atoi((char*)sLastChan.GetBuffer(sLastChan.GetLength()));

由于Win32 API文档的函数列表使用函数的常用名字(例如, SetWindowText”),所有的字符串都是用TCHAR来定义的。(除了XP中引入的只适用于Unicode的API)。

LPTSTR 转换成 CString

(1)直接赋值
CString strText;
LPTSTR lpszText = _T("LPTSTR >> CString");
strText = lpszText;
MessageBox(NULL, strText, _T("标题"), MB_ICONASTERISK|MB_TASKMODAL|MB_OK);
(2)CString::Format()格式化
CString strText;
LPTSTR lpszText = _T("LPTSTR >> CString");
strText.Format(_T("%s"), lpszText );
::MessageBox(NULL, strText, _T("标题"), MB_ICONASTERISK|MB_TASKMODAL|MB_OK );

CString 转换成 LPTSTR

(1)强制转换
CString strText(_T("This is a test"));
LPTSTR lpszText =(LPTSTR)(LPCTSTR)strText;
::MessageBox(NULL, lpszText, _T("标题"), MB_ICONASTERISK|MB_TASKMODAL|MB_OK);
(2)使用lstrcpy()
CString strText("This is a test");
LPTSTR lpszText = new TCHAR[strText.GetLength()+1];
lstrcpy(lpszText, strText);
::MessageBox(NULL, lpszText, _T("标题"), MB_ICONASTERISK|MB_TASKMODAL|MB_OK);
(3)使用CString::GetBuffer()
CString strText(_T("This is a test "));
LPTSTR lpszText = strText.GetBuffer();
strText.ReleaseBuffer();
::MessageBox( NULL, lpszText, _T("标题"),MB_ICONASTERISK|MB_TASKMODAL|MB_OK );
/* char * 转换成 CString
char chArray[] = "This is a test";
char * p = "This is a test";
CString theString = chArray;
theString.Format(_T("%s"), chArray);
theString = p;
/* CString转换成char*
CString theString( "This is a test" );
LPTSTR lpsz = new TCHAR[theString.GetLength()+1];
_tcscpy(lpsz, theString);
// 或
CString s(_T("Char test "));
LPTSTR p = s.GetBuffer(); 
LPTSTR dot = strchr(p, ''.'');
// 在这里添加使用p的代码
if(p != NULL)
*p = _T('');
s.ReleaseBuffer();

c++中LPTSTR

编辑

LPCTSTR,LPWSTR, PTSTR, LPTSTR,wchar_t区别

L表示long指针,这是为了兼容Windows 3.1等16位操作系统遗留下来的,在win32中以及其他的32位操作系统中, long指针和near指针及far修饰符都是为了兼容的作用,没有实际意义。即win32中,long,near,far指针与普通指针没有区别,LP与P是等效的。

下面列出一些常用的typedefs:

类型MBCSUnicode
WCHAR wchar_twchar_t
LPSTR char*char*
LPCSTR const char*const char*
LPWSTRwchar_t*wchar_t*
LPCWSTR const wchar_t*const wchar_t*
TCHAR char wchar_t
LPTSTR TCHAR*(或char*)TCHAR* (或wchar_t*)
LPCTSTR const TCHAR*(或const char*)const TCHAR*(或const wchar_t*)
常用的typedefs

所以为提高可移植性,定义字符串时用TCHAR,转化为UNICODE时用_T而不用L。


已发布

分类

来自

标签:

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

这个站点使用 Akismet 来减少垃圾评论。了解你的评论数据如何被处理