--求共同探讨以下问题
(一)大数据处理user.txt中存放了400万余条用户编号(user_id)、密码(password)的记录。格式为:
user_id password
每行一条记录,user_id和password中间为TAB分隔(即C语言中的\t)。
请作如下处理:
(1)读取文件中的密码(password)字段,统计密码出现的次数count,写入文件password.txt。不需要排序。格式如下:
password count
每行一条记录,password和count中间用TAB分隔(即C语言中的\t)。
(2)读取password.txt,对密码出现次数按照降序排序。
分别采用:直接插入排序、希尔排序、冒泡排序、快速排序、直接选择排序、堆排序、归并排序;
求出每种排序方法所需要的绝对时间。屏幕上输出各种各种排序的绝对时间。
最后屏幕上输出出现次数最多的20个密码及次数。
(3)读取user.txt,使用链表存放,使用顺序查找,由键盘输入user_id,输出其密码,以及查找所花的时间。另外随机生成20个user_id password,输出查找所花时间。
(4)读取user.txt,按照用户id使用二叉排序树存放,由键盘输入user_id,输出其密码,以及查找所花的时间。另外随机生成20个user_id,输出查找所花时间。
(5)选做:读取user.txt,按照用户id使用AVL树存放,由键盘输入用户id,输出其密码,以及查找所花的时间。