Data Structures with Java—table(1)

类别:Java 点击:0 评论:0 推荐:
昨天实现MVC那个小程序里,建模javaBean的时候用了HashMap.晚上回去的时候看了一下,一点都不难,印象是有点象sql里面的table.想到这里,突然觉得自己的横向思维比逻辑思维要强一点,这样也许不好. table 是一种容器型数据结构,一个很好的类比就是字典里面的单词和对其详细的解释.表是序偶序列,序偶的第一部分为key,索引,相当于数组里的下标.第二部分是对应的value.table 也称做关联数组, 可以用两个并列的数组来实现,一个保存key,一个保存value.其中java.util 的Map 接口定义了4个实现(not JDK5.0),AbstractMap, HashMap, TreeMap , WeakHashMap. Map map=new HashMap(); map.put("a", "day"); map.put("b", "month"); map.put("c", "year"); map.put("d", "min"); map.put("e", "second"); map.put("f", "hour"); System.out.println("map=\t"+map); //toString() method. System.out.println("map.size=\t"+map.size()); System.out.println("map.keySet=\t"+map.keySet()); System.out.println("map.values=\t"+map.values()); System.out.println("map.get(\"c\")=\t"+map.get("c")); System.out.println("map.remore(\"c\")=\t"+map.remove("c")); System.out.println("map=\t"+map); System.out.println("map.size=\t"+map.size()); run result: map= {d=min, a=day, c=year, f=hour, b=month, e=second} map.size= 6map.keySet= [d, a, c, f, b, e] map.values= [min, day, year, hour, month, second] map.get("c")= year map.remore("c")= year map= {d=min, a=day, f=hour, b=month, e=second} map.size= 5 HashMap里的key/value 存储顺序取决于table 的容量和这些对象的hashcode public static void main(String[] args) { printHashCode("abc"); printHashCode("def"); printHashCode("ghi"); printHashCode("jkl"); printHashCode("abc"); } public static void printHashCode(String word) { System.out.println(word+":"+word.hashCode()); } Run result: abc:96354 def:99333 ghi:102312 jkl:105291 abc:96354 Hash table是一种类型, 它使用一个特别的函数从key 计算出数据值来确定存储位置,这个特别的函数称为Hash函数. private static final int MASK=0x7FFFFFFF; //2^32-1 private static final int CAPACITY=11; //capacity is 11 public HashCode() { } public static void main(String[] args) { printHashCode("Ohr"); printHashCode("Tor"); printHashCode("Hut"); printHashCode("Rad"); printHashCode("Tag"); printHashCode("Uhr"); } public static void printHashCode(String word) { System.out.println(word+":"+ hash(word)); } public static int hash(String object) { return (object.hashCode()&MASK)%CAPACITY; } Run result: Ohr:73 Tor:45 Hut:13 Rad:99 Tag:4 Uhr:82 这里, (object.hashCode()&MASK)%CAPACITY; private static final int MASK=0x7FFFFFFF; //2^32-1 private static final int CAPACITY=11; //capacity is 11 capacity is 11, mask=2^32-1=2 147 483 647 object.hashCode()&MASK 是将符号去掉,否则,除余后也是负数.这个程序里,return 的结果必在0~10之间. Rad:3 Tag:3 出现冲突,最常用的方法就是: 把Tag放在最后(程序举例问题,把上面程序里的abc也改成这里的).这种冲突消除算法的名字是:线性探测算法 如果把capacity 改为101,则return 的结果为0~100, 和我们建立HashMap 对象后的顺序相同(改一前面的程序),我测试了一下,看到结果不同,但起码说明了这个原理(可能是JDK版本不同的原因?) 如果用容量为10的hash table存储6个元素,性能可以的,但是我们如果用6个存取6个呢? 衡量Hash table 的拥挤程度,负载系数(load factor): 实际元素/CAPACITY 如果实际等于容量,则系数是100%,如果系数大于容量,则? 容量的缺省值是100,默认的负载系数为75%.如果超过负载系数,则增大它的容量. HashMap(int initialCapacity, float loadFactor) Constructs an empty HashMap with the specified initial capacity and load factor. 线性探测的原理是当一个元素被hash 函数定位到一个已经使用的位置的时候,算法将递增位置索引直到找到一个空位置,如果到了hash表的最后,就跳到初始位置. 平方探测 public static int hash(String object) { ++size; int h= (object.hashCode()&MASK)%CAPACITY; int jump=1; while(used[h]) { int g=h; System.out.print(h+","); h=(g+jump*jump)%CAPACITY; jump++; } 在探测的时候会跳过很多元素,重而位置比较均匀.性能比较高 独立链: 避免冲突,允许Hash每个空位可以放置多个元素,这一方法使用链表来存放多个元素,表的空位被称做吊桶. Java.util.HashMap 类就是使用的对立链.

本文地址:http://com.8s8s.com/it/it11766.htm