开发记录
待办列表
- 主进程进度不显示
- 子进程显示不合理
- 聚合速度需要进一步优化
- 修改缓存建立方式(目前:1.5秒/个,期望:降到目前的10倍以下)
- 修改子进程任务获取方式
开发进度
- 2024-01-18
- 移除bitmap依赖包
- 导出conda环境文件
- 计算结果文件改为归档而不是删除
- 2024-01-17
- 增加多进程初始化
- 长尾词聚合增加使用多线程
- 多进程多线程使用tqdm显示进度
- 2024-01-16
- 2023-12-15
- 2023-07-05
- 2023-07-06
- 2023-07-08
- 增加支持4级筛选;调整界面结构,增大结果区域
- 增加历史记录功能,能打开上一次的位置
- 增加显示筛选数量和结果数量
进程相关
- 普通的只有一个进程
- 普通使用ProcessPoolExecutor只有4个进程
- 如果使用Manager会额外多一个进程
文件位置相关
- with open 与 mmap 读取到的每行的位置是一样的
文件读取速度比较
- 从单进程的角度看:仅以顺序读文件来说mmap的速度快很多,如果对内容进行编码,速度也较with open快一点
- 从多进程的角度看:仅以顺序读文件来说mmap的速度快很多,如果对内容进行编码,速度也较with open快一点
- 仅以顺序读取同一个文件,with open 与 mmap 均是 单进程读取一次的速度 比 多进程读取一次要快,而且with open的差距更明显
- 多进程分段读取中 mmap比with open快很多,with open非常的慢
- 总结:
- mmap(单)>>mmap(单,对内容进行编码)>with open(单)
- mmap(多)>>mmap(多,对内容进行编码)>with open(多)
- (这个结论没啥用处,因为多进程一般是完成不同的任务)仅以顺序读取同一个文件,with open 与 mmap 均是 单进程读取一次的速度 比 多进程读取一次要快,而且with open的差距更明显
- 多进程分段读取中 mmap比with open快很多,with open非常的慢
conda命令
conda环境重命名(复制一个新的环境,然后把旧的环境删除)
conda create -n tf --clone rcnn #把环境 rcnn 重命名成 tf
conda remove -n rcnn --all