README.zh.md
May 8, 2023 · View on GitHub

通过向量降维, 极速探索和批量标注数据, 并用作模型训练或其它用途.
hover 是一个批量标注数据的工具, 只需数据能被向量表示.
- 标注过程很简单, 如同给散点图上色.
- 通过移动鼠标和框选, 来观察数据(在降维后的)点簇.
- 使用小工具(如搜索/过滤/规则/主动学习)来提升精度.
- 输入合适的标签, 并点击"Apply"按钮, 即可标注!

:rocket: 在线演示
Notebook教程
- 查看含代码的教程, 可在浏览器中编辑和运行, 无需安装依赖.
示例标注界面
- 跳过所有代码, 进入托管在Binder上的标注界面.
:sparkles: 具体功能
:telescope: 将向量降维得到二维数据散点图, 并配有
提示框 来显示具体数据内容
表格来 批量检视 选中的数据
切换按钮来 区分数据子集
文本/正则匹配 来定向搜寻数据
:microscope: 与标注界面同步的辅助模式
`Finder`: 以匹配条件来 过滤 选中的数据
`SoftLabel`: 主动学习 用模型打分过滤选中的数据
`Snorkel`: 自定义函数 来过滤数据或直接打标
:toolbox: 更多的补充工具
降维时保留 更多维度 (3D? 4D?) 并动态选择观察的平面
跨界面/跨维度地进行 持续选取/反选 以达到更高精度
剔除选中数据中的异类 以及 修订发现的误标
:package: Install
Python: 3.8+
OS: Linux & Mac & Windows
PyPI: pip install hover
Conda: conda install -c conda-forge hover
:book: 资料
:flags: 新动态
- Jan 21, 2023 新版本 0.8.0 已就绪, 可查看 changelog 获悉详情 :partying_face:.
:bell: 其它说明
鸣谢和推荐
- 我们推荐
Bokeh可视化框架,hover正是基于它的图表同步和回调函数来实现非常重要的功能. - 感谢 Philip Vollet 在
hover的迭代早期 无偿地帮助在开源社区内推广.
提供贡献
- 我们欢迎任何反馈, 特别是使用中的痛点!
./requirements-dev.txt列出了开发者所需的依赖.- 我们建议在提交PR前启用.pre-commit-config.yaml中列出的pre-commit hook.
引用
如果hover对您的工作有帮助, 请告诉我们或引用 :hugs:
@misc{hover,
title={{hover}: label data at scale},
url={https://github.com/phurwicz/hover},
note={Open software from https://github.com/phurwicz/hover},
author={
Pavel Hurwicz and
Haochuan Wei},
year={2021},
}