ASP在用Scripting.FileSystemObject打开或保存文件时的编码问题是个难题,因为
Scripting.FileSystemObject只能读取或保存为两种格式的编码文件,一种是ASCII,另一种是Unicode,不能指定为
UTF-8等其他编码格式。
且看读取文本文件的OpenTextFile方法:
语法:object.OpenTextFile(filename[, iomode[, create[, format]]])
作用:打开一个指定的文件并返回一个 TextStream 对象,该对象可用于对文件进行读、写、追加操作。
说明:
iomode 参数可为下面设置值中的任何值:
ForReading 1 打开一个只读文件,不能对此文件进行写操作。
ForWriting 2 打开一个用于写操作的文件。如果和此文件同名的文件已存在,则覆盖以前内容。
ForAppending 8 打开一个文件并写到文件的尾部。
注意:在VBA帮助里是没有ForWriting的,其实是有的,VBA帮助也是有错误的。另外,这些常数在使用前要先声明,或者直接用数值。
create 可选的,它表示如果指定的 filename 不存在是否可以创建一个新文件。如果创建新文件,其值为 True。若不创建文件其值为 False。缺省值为 False。
Format 参数可为下面设置值中的任何值:
TristateUseDefault –2 使用系统缺省打开文件。
TristateTrue –1 以 Unicode 格式打开文件。
TristateFalse 0 以 ASCII 格式打开文件。
再看创建文本文件的CreateTextFile方法:
object.CreateTextFile(filename[, overwrite[, unicode]])
说明:指定的文件名并返回一个 TextStream 对象,可以使用这个对象对文件进行读写。
参数:
object
必选项。 应为 FileSystemObject 或 Folder 对象的名称。
filename
必选项。 指明所要创建文件的字符串表达式。
overwrite
可选项。 Boolean 值,指明能否覆盖已有文件。 假如文件可以覆盖,则值为 true ,否则为 false 。 假如忽略,则已有文件不能被覆盖。
unicode
可选项。 Boolean 值,指明文件是否以 Unicode 或 ASCII 文件方式创建。 假如文件作为 Unicode 文件创建,则值为 true ,假如作为 ASCII 文件创建,则为 false。 假如忽略,则假定为 ASCII 文件。
所以,利用Scripting.FileSystemObject创建和读取文本文件时都无法指定为UTF-8等其他编码格式,只能指定为ASCII或UNICODE编码。
这时候,我们可以使用 ADODB.Stream 对象,使用方法见下面:
Set objStream = Server.CreateObject("ADODB.Stream")
With objStream
.Open
.Charset = "utf-8"
.Position = objStream.Size
.WriteText=str
.SaveToFile server.mappath("/sitemap.xml"),2
.Close
End With
Set objStream = Nothing
附:
ASCII 、Unicode 、 UTF-8 介绍:
ASCII 是一种字符集,包括大小写的英文字母、数字、控制字符等,它用一个字节表示,范围是 0-127。
由于 ASCII 表示的字符非常有限,各个国家或者地区在此基础上提出了自己的字符集,比如在中国应用非常广泛的 GB2312,它为汉字提供了编码,用两个字节表示。
这些字符集之间互不兼容,相同的数字可能表示不同的字符,为信息交流带来了麻烦。
Unicode 是一种字符集,它将世界上的所有字符映射成一个唯一的数字(code point),比如字母 a 对应的数字 0x0041。目前 Unicode 还处于发展中,它所包容的字符越来越多。
在将 Unicode 表示的字符进行存储时,还需要一定的编码方式,比如 UCS-2,它用两个字节来表示 Unicode 编码的字符。而 UTF-
8 是 Unicode 字符集的另外一种编码方式,它是变长度的,最多 6 个字节,小于 127 的字符用一个字节表示,与 ASCII 字符集的结
果一样,因而具有非常好的兼容性,ASCII 编码下的英语文本不需要修改就可以当作 UTF-8 编码进行处理,应用非常广泛。