本文转载自公众号“读芯术”(ID:AI_Discovery)。
从搜索引擎、情绪分析到虚拟助手和聊天机器人,文本注解工具和服务应用广泛。
在人工智能研发行业,注解数据如同黄金,而大量优质注解数据则犹如一座金矿。对一个团队来说,查找或创建此类数据代价高昂、任务艰巨。幸运的是,各种文本注解工具和服务可以为你提供所需数据,包括实体提取、词性标注、情感分析等。
Tagtog
Tagtog公司总部位于波兰,是一种文本注解工具,可自动或手动注解文本。Tagtog不仅支持本机PDF注解,还支持预先训练的自动注解文本NER模型。除了Tagtog工具,该公司还拥有囊括各领域的专家网络,可以对专门的文本进行注解。
Lionbridge AI
Lionbridge专门从事语言学研究,拥有一个多语言注解人员社区,规模达100万人,精通300多种语言。文本注解服务包括文本提取、情感分类、实体注解、命名实体识别和语言成分分析等。此外,Lionbridge还提供了一个自定义数据注解软件,你的团队可以授权并将其用于各种文本注解项目。
Scale
Scale公司位于旧金山,是一家提供计算机视觉和NLP数据注解服务的公司。通过将人工工作和Scale平台相结合,该公司提供以下文本注解服务:OCR转录、文本分类和比较。
Dandelion API
Dandelion API总部位于意大利,提供各种自动文本注解工具。虽然这家公司刚刚起步,但他们的工具可以用于实体提取、情感分析、文本和内容分类。
KConnect
许多AI研发人员面临的问题之一是如何访问高度专业化的AI培训数据。KConnect团队致力于帮助注解人员快速有效地对医疗数据进行分类和注解。具体来说,KConnect为医学信息提供语义注解、文本分析和语义搜索服务。
Clickworker
Clickworker是一家总部位于美国和德国的众包公司,员工基数大,能够完成各种各样的任务。他们提供的文本注解服务有:情感分析和分类。
LightTag
LightTag文本注解工具是一个供注解者和公司在内部标记文本数据的平台。虽然初始包是免费的,但每个包级别的成本都有所上升,并且每个月的注解数量也有所限制,每月免费提供1000个注解。
ParallelDots Text Annotation APIs
ParallelDots是众多文本注解工具和API的供应商。他们的解决方案包括:情感分析、情绪分析、关键字提取和命名实体识别。
图源:Google
Appen
Appen众包员工来自不同国家,数量庞大,是多种AI培训数据的供应商。例如,他们文本注解服务包括:情感注解、意图注解和命名实体注解。
Dataturks Text Annotation Tools
借助用于数据注解的内部API和数千家外包伙伴公司,Dataturks提供了各种图像注解和文本注解工具。具体来说,他们的文本标记能力包括:文本分类、命名实体识别和词性标注。
希望你能找到适合自己的工具。