hum.db二进制文本分析

类别:.NET开发 点击:0 评论:0 推荐:
hum.db二进制文本分析

在传奇私服中有个文件:HUM.DB,这个文件虽然扩展名看来象个数据库文件,其实它是个的的确确的二进制文件,这个文件中存贮着关于用户的注册信息,要想分析用户注册情况,分析这个文件必不可少的。用ULTRAEDIT打开这个文件,发现其中有直接能读出来的信息,那么用VB.NET怎么样分析它呢?以下为学习的笔记:

(1)在ULTRAEDIT中,为了显示美观,每两个字节的位置,其实是一个ASC码,如:00 12其实只是表示了两个ASC码值,而一个汉字,也正如教科书中说的那样,占了两个ASC码的位置。明白这一点,在编程时就不会感觉奇怪了(如在ULTRAEDIT中显示的是03,而在编程时读出来的是3,呵呵,太菜了,费了半个多小时才搞明白,别笑我啊)。

(2)在编程中,因为是二进制的转换,对于特殊字符,是没有对应的显示字符的,对于这一部分,要想办法特殊处理,如对于不能正常显示的字符,找个可以显示的字符代替。

(3)应用的类主要是FileStream,与BinaryReader,其中后面的那个的READ方法要注意重载函数类型很多,所以编程时要选择应用。

(4)简单分析了一下这个文件,可以看出每个注册用户前面是角色名称,后面是注册ID,这种数据结构可以想象一下,基本上与普通的数据库存贮结构是一样的。现在关键是找出文件头(这部分可能是其它的信息)及每条记录的长度(不可能长度不一样吧,如果是长度不一样,编程费事不说,查找速度也慢,我想做这个程序的人是不会用这么复杂的方法的)。

看第一个用户的注册名与第二个用户的注册名,发现其间差了72个字节,基本上可以肯定每条记录应当是72字节。好,下面就先提出所有的注册用户名再说吧。编程~~~~~~~~~~~

OpenFileDialog1.ShowDialog()
        If OpenFileDialog1.FileName = "" Then
            MessageBox.Show("请选择一个打开的文件", "打开文件错误", MessageBoxButtons.OK, MessageBoxIcon.Error, MessageBoxDefaultButton.Button1)
            Exit Sub
        End If

        Dim fs As FileStream = New FileStream(OpenFileDialog1.FileName, FileMode.Open)
        Dim r As BinaryReader = New BinaryReader(fs)
        Dim i As Integer
        Dim char_read As String
        Dim string_read As String
        Dim ii
        For i = 1 To 168

            char_read = r.ReadByte.ToString
        Next

        For ii = 1 To 20
            char_read = ""
            string_read = ""
            For i = 1 To 72
                char_read = r.ReadByte.ToString
                'string_read = string_read + Hex(Val(char_read))

                string_read = string_read + Chr(char_read)
            Next
            ListBox1.Items.Add(string_read)

        Next
        r.Close()

可以看出,已经正确的提取出了用户注册名。但是,对于汉字注册名称,并不能正确显示。
分析原因可能如下:
由于传奇是DELPHI开发,国内汉化,应当是支持GB-2312编码,通过分析其二进制文件得知,在HUM.DB中,一个英文字符占一个字节,而非UNICODE所说的占两个字节。而对于VB.NET则已经默认支持UNICODE,所以在代码转换上就出了问题.
相关实验如下:
在PB9中:char(222)+char(222)能正常显示汉字,
而在VB.NET中chr(222) + chr(222)就不能显示汉字,
可以看出两者的编码处理方式不一样.

本文地址:http://com.8s8s.com/it/it43777.htm