在从c到c++的学习过程中,仅仅了解到stl标准模板库中的string、wstring类型,在学习windows程序开发和MFC框架的时候,了解到了wchar、tchar、LPWSTR、LPCSTR、LPCWSTR、LPTSTR等字符和字符串类型。这里记录一下他们的介绍、用法和相互转换的方法。
首先介绍一下wchar和tchar
wchar
Windows为了消除各编译器的差别,重新定义了一些数据类型,你提到了另外几个类型都是这样。CHAR为单字节字符。还有个WCHAR为Unicode字符,即不论中英文,每个字有两个字节组成。它实际定义在<string.h>里:
typedef unsigned short wchar_t。
下面再看看TCHAR
如果希望同时为ANSI和Unicode编译的源代码,那就要include <TChar.h>。TCHAR是定义在其中的一个宏,通过你是否定义了_UNICODE宏而定义成char或者wchar_t。如果当前编译方式为ANSI(默认)方式,TCHAR等价于CHAR,如果为Unicode方式,TCHAR等价于WCHAR。
相关用法
wchar_t和tchar都有自己的字符串函数,不能使用strcpy这类ANSI C字符串函数。必须使用wcs前缀的函数,例如wcscpy。为了让编译器识别Unicode字符串,必须以在前面加一个“L”,例如:
wchar_t *szTest=L"This is a Unicode string.";
TCHAR也不能使用ANSI的strXXX函数或者Unicode的wcsXXX函数了,必须使用TChar.h中定义的_tcsXXX函数。另外,为了解决刚才提到带“L”的问题,TChar.h中定义了一个宏:“_TEXT”。
以strcpy函数为例子,总结一下:
.如果你想使用ANSI字符串,那么请使用这一套写法:
char szString[100];
strcpy(szString,"test");
.如果你想使用Unicode字符串,那么请使用这一套:
wchar_t szString[100];
wcscpyszString,L"test");
.如果你想通过定义_UNICODE宏,而编译ANSI或者Unicode字符串代码:
TCHAR szString[100];
_tcscpy(szString,_TEXT("test"));
LPWSTR、LPCSTR、LPCWSTR、LPTSTR
LPCSTR是一个指向以’\0’结尾的常量字符的指针。
LPWSTR是一个指向wchar_t字符串的字符指针。
LPCWSTR是一个指向unicode编码字符串的32位指针,所指向字符串是wchar型,而不是char型。它的声明如下:
typedef const wchar_t* LPCWSTR;
LPSTR是一个指向以NULL(‘\0’)结尾的32位ANSI字符数组指针,LPWSTR是一个指向以NULL结尾的64位双字节字符数组指针。都是以零结尾的字符串指针,相当于CHAR *
这些类型的来源都是缩写:
L来自long,指长的;
P是pointer,代表指针;
LP:长指针(long pointer),这是为了兼容Windows 3.1等16位操作系统遗留下来的,在win32中以及其他的32位操作系统中,long指针和near指针及far修饰符都是为了兼容的作用,没有实际意义。即win32中,long,near,far指针与普通指针没有区别,LP与P是等效的;
T:win32环境中有一个_T宏,用来标识字符是否采用Unicode编码(两字节表示一个字符),若程序中定义了Unicode,该字符/字符串被作为Unicode字符串,否则就是标准的ANSI(单字节表示一个字符)字符串。
C的话是const,说明是个常量;
W就是wide char(wchar),指的是宽字符;
STR顾名思义,就是string字符串啦!
这些字母互相组合,就构成了这些字符串数据类型,可以根据需要来选用。
相互转换
cstring 转换为 *
/* cstring 转 string */
CString cs(_T("cs"));
string s;
s = (LPCSTR)(CStringA)(cs);
/* CString转换成LPCWSTR、LPWSTR、LPCSTR、LPSTR */
//VS2005中CString已经改为宽字符型
LPWSTR lpstr = (LPWSTR)(LPCWSTR)str;
LPCSTR lpcstr = (LPCSTR)(LPCWSTR)str;
LPSTR lpcstr = (LPSTR)(LPCWSTR)str;
/* CString转换成char* 、TCHAR* */
char* p = (char*)str.GetBuffer(); //方法1
char* p = (LPSTR)(LPCTSTR)str; //方法2
TCHAR* pw = str.GetBuffer();
string 转换为 *
/* string 转 cstring */
string s ="Hello World!中国"; //方法1
CString cs(s.c_str()); //方法2,用c_str()确实比data()要好 CString.format(”%s”, string.c_str());
/* string 转 lpcstr */
std::string a="abc";
LPCSTR str = a.c_str();
/* string转换为LPWSTR */
wstring widstr<em>;
std:string s("DanTeng");
widstr = std::wstring(s.begin(), s.end());
lvItem.pszText=(LPWSTR)widstr.c_str();
/* string转换为int、float */
//可以使用atoi,atof,atol等函数来完成。
LPCWSTR 转换为 *
/* LPCWSTR转换成CString */
LPCWSTR lpcwStr = L"TestWStr";
CString str(lpcwStr);
LPWSTR 转换为 *
/* LPWSTR 转换成LPWSTR */
LPWSTR lpwstr = (LPCSTR)lpstr;
lpwstr = (LPWSTR)lpcstr;
LPCSTR 转换为 *
/* LPCSTR 转换成CString */
LPCSTR lpcStr = (LPCSTR)str;
/* LPWSTR 转换成LPWSTR */
LPWSTR lpwstr = (LPCSTR)lpstr;
LPSTR 转换为 *
/* LPSTR 转换成CString */
LPSTR lpStr = L"TestStr";
CString str(lpStr);
/* LPSTR 转换成LPCSTR、LPWSTR 、LPCWSTR */
LPCSTR lpcstr = lpstr;
LPWSTR lpwstr = (LPWSTR)lpstr;
LPCWSTR lpcwstr = (LPCWSTR)lpstr;
char* 转换为 *
/* char* 转换成CString */
char* p = "test"; //方法1
CString str = ("%s",p); //方法2
CString.format(”%s”, char*);
/* char* 转换成string*/
string s(char *); //只能初始化,非初始化的地方还是用assign().
/* char* 转换成LPSTR、LPCSTR */
char *p;
LPSTR lpstr = p;
LPCSTR lpcstr = p;
/* char* 转换成WCHAR */
wchar_t ws[100];
swprintf(ws, 100, L"%hs", "ansi string");
/* char* 转换成LPCWSTR */
参考:C++中char*转换为LPCWSTR的解决方案
TCHAR * /WCHAR* 转换为 *
/* TCHAR* 转换成char* */
p = (char*)sex;
/* WCHAR* 转换成TCHAR* */
pw = (WCHAR*)name;
/* WCHAR* 转换成char* */
char output[256];
WCHAR* wc = L"Hellow World";
sprintf(output, "%ws", wc );
在当前版本LPCSTR和LPSTR没区别,即。
LPCSTR, A 32-bit pointer to a constant character string.
常量指针,一般用于参数传递和固定字符串
LPSTR, A 32-bit pointer to a character string.
普通指针,一般用于字符串操作
根据DBCS或Unicode 自动选择char或wchar_t类型,由定义的宏_UNICODE决定
LPCTSTR, A 32-bit pointer to a constant character string that is portable for Unicode and DBCS.
LPTSTR, A 32-bit pointer to a character string that is portable for Unicode and DBCS.
一个转换CString 的例子。
CString str = "ABC";
LPCTSTR ptr1 = new TCHAR[str.GetLength()+1];
ptr1 = (LPCTSTR) str.GetBuffer();
LPTSTR ptr2 = new TCHAR[str.GetLength()+1];
ptr2 = (LPTSTR) str.GetBuffer();
LPSTR ptr3 = new char[str.GetLength()+1];
ptr3 = (LPSTR) str.GetBuffer();
LPCSTR ptr4 = new char[str.GetLength()+1];
ptr4 = (LPCSTR) str.GetBuffer();
另外,要注意选用的函数也要和string类型一致。比如下面:tmp1=144,tmp2=1,因为sLastChan为宽字节,存储为310034003400, atoi函数遇到第一个”00″就会结束。
CString sLastChan = _T("144");
int t,tmp2;
t=_tstoi((TCHAR*)sLastChan.GetBuffer(sLastChan.GetLength()));
tmp2=atoi((char*)sLastChan.GetBuffer(sLastChan.GetLength()));
由于Win32 API文档的函数列表使用函数的常用名字(例如, SetWindowText”),所有的字符串都是用TCHAR来定义的。(除了XP中引入的只适用于Unicode的API)。
LPTSTR 转换成 CString
(1)直接赋值
CString strText;
LPTSTR lpszText = _T("LPTSTR >> CString");
strText = lpszText;
MessageBox(NULL, strText, _T("标题"), MB_ICONASTERISK|MB_TASKMODAL|MB_OK);
(2)CString::Format()格式化
CString strText;
LPTSTR lpszText = _T("LPTSTR >> CString");
strText.Format(_T("%s"), lpszText );
::MessageBox(NULL, strText, _T("标题"), MB_ICONASTERISK|MB_TASKMODAL|MB_OK );
CString 转换成 LPTSTR
(1)强制转换
CString strText(_T("This is a test"));
LPTSTR lpszText =(LPTSTR)(LPCTSTR)strText;
::MessageBox(NULL, lpszText, _T("标题"), MB_ICONASTERISK|MB_TASKMODAL|MB_OK);
(2)使用lstrcpy()
CString strText("This is a test");
LPTSTR lpszText = new TCHAR[strText.GetLength()+1];
lstrcpy(lpszText, strText);
::MessageBox(NULL, lpszText, _T("标题"), MB_ICONASTERISK|MB_TASKMODAL|MB_OK);
(3)使用CString::GetBuffer()
CString strText(_T("This is a test "));
LPTSTR lpszText = strText.GetBuffer();
strText.ReleaseBuffer();
::MessageBox( NULL, lpszText, _T("标题"),MB_ICONASTERISK|MB_TASKMODAL|MB_OK );
/* char * 转换成 CString
char chArray[] = "This is a test";
char * p = "This is a test";
CString theString = chArray;
theString.Format(_T("%s"), chArray);
theString = p;
/* CString转换成char*
CString theString( "This is a test" );
LPTSTR lpsz = new TCHAR[theString.GetLength()+1];
_tcscpy(lpsz, theString);
// 或
CString s(_T("Char test "));
LPTSTR p = s.GetBuffer();
LPTSTR dot = strchr(p, ''.'');
// 在这里添加使用p的代码
if(p != NULL)
*p = _T('');
s.ReleaseBuffer();
c++中LPTSTR
编辑
LPCTSTR,LPWSTR, PTSTR, LPTSTR,wchar_t区别
L表示long指针,这是为了兼容Windows 3.1等16位操作系统遗留下来的,在win32中以及其他的32位操作系统中, long指针和near指针及far修饰符都是为了兼容的作用,没有实际意义。即win32中,long,near,far指针与普通指针没有区别,LP与P是等效的。
下面列出一些常用的typedefs:
| 类型 | MBCS | Unicode |
| WCHAR | wchar_t | wchar_t |
| LPSTR | char* | char* |
| LPCSTR | const char* | const char* |
| LPWSTR | wchar_t* | wchar_t* |
| LPCWSTR | const wchar_t* | const wchar_t* |
| TCHAR | char | wchar_t |
| LPTSTR | TCHAR*(或char*) | TCHAR* (或wchar_t*) |
| LPCTSTR | const TCHAR*(或const char*) | const TCHAR*(或const wchar_t*) |
所以为提高可移植性,定义字符串时用TCHAR,转化为UNICODE时用_T而不用L。

发表回复