在Azavea,我们的使命是为公民和社会影响创造先进的地理空间技术和研究。该使命使我们成为一些有趣的地方 - 我们已经与世界银行合作尝试减少全球交通事故,创建开源工具将机器学习应用于卫星图像,甚至在法庭上作证基于我们对Gerrymandering的研究以及如何解决它

旨在对我们的工作中的公民和社会影响是我们宪法的基础,作为我们将其写入我们的宪章中的公司。和A.B公司认证,我们参加了从碳足迹的一切审计,以雇员赔偿,我们参与我们当地的费城社区。

Azavea在费城的办公室Azavea在费城的办公室

我只想说,为了追求这些崇高的理想,我们发现自己在权衡商业决策时倾向于从长远考虑……的真的长远的眼光。事实上,我们的目标是在100年内存在。而我们在科技世界中竞争的大多数公司都痴迷于新的东西,我们更专注于这些东西长期改变。从现在来看,我们认为人们仍将重视基于证据的见解,优质的客户服务和令人愉快的产品体验。要在那些承诺来看,几十年来,我们不可能独自一人 - 所以我们总是在寻找分享我们价值观的合作伙伴并与我们的兴趣保持一致。

发动机需要燃料,机器学习模型需要标记数据

我们工作的性质往往涉及争吵大量的地理空间数据,从地面的雨水径流测量到通过空气传播的GPS数据,到卫星图像流出空间。我们努力将这些大规模的嘈杂的数据集减少到客户关注的相关信息。机器学习的最新进展(和应用新ML方法)大大扩展了我们可以使用这些大地理空间数据集的问题次数,并同时降低与提出这些问题的成本和时间。

在过去的几年里,我们已经看到了项目吞吐量从ML工程能力转移到培训数据收集和一代的限制因素。我将我们的ml工程组织比较到豪华的汽车发动机,需要高度精炼的燃料,以有效运行......我们有燃料短缺:标记训练数据的短缺。

Azavea工程团队Azavea工程团队每天“站立”会议

最初,我们决定首先在内部创建培训数据。虽然具有标记数据的第一手经验是有帮助的,但我们很快意识到扩展的最有效的方式是外包给专家。因此,我们寻求兼容的标签合作伙伴始于认真。

CloudFactory在数据标识公司中脱颖而出

我们采访了一些领导者数据标签公司,而且习惯于他们的定价,方法,甚至他们的文化价值观。CloudFactory出于多种原因而脱颖而出。

1.任务调整- CloudFactory创建的目标一百万高质量的工作因为发展中国家的人给我们的印象是既雄心勃勃又激动人心。Azavea的核心价值之一是确保每一位员工真诚地相信他们的工作“可以为一个更和平、公正和繁荣的世界做出贡献”。CloudFactory的使命是在经济上增强人们的能力,并将他们与数字经济联系起来,直接符合同样的核心价值。他们的使命不仅是全球性的,而且与我们团队的直接互动也很完美。我们开始信任并依赖尼泊尔的项目负责人和北卡罗来纳州达勒姆的客户成功经理。我们每天都和项目负责人交谈,我们每隔一周召集客户和项目负责人进行一次电话汇报。通常,一个公司对社会影响的宏伟愿景不会转化为卓越的客户体验,但在CloudFactory的案例中,它绝对可以。

2.相互投资- 一个地理空间数据的怪癖是它对显示而且文件格式可以是......奇怪的。我们尝试了其他标签工具,但卫星,无人机和空中图像总是感觉到用户体验中的二等公民。所以我们建造了自己的内部工具,而且云即云不仅可以热情同意使用它,但已成为我们努力不断改进产品的无价值的反馈来源。在早期,当我们在用户体验中锻炼扭结时,他们对我们感到特别耐心,并且是关于错误和最佳实践的通信。(毕竟,他们已经使用了太阳下的每个注释工具。)拥有愿意投资时间和能量的合作伙伴来帮助我们改善我们的工具一直是我们现在无法想象的意外价值。

Azavea的注释工具屏幕截图显示Geospatial Imagery的Azavea的注释工具

3.咨询的方法-令人惊讶的是,CloudFactory是唯一一个严重挑战我们关于如何组织标签工作的假设的数据标签服务。最初,我们要求几个注释员根据我们从自己的内部工作中看到的生产力预测,每周专门标记40个小时。然而,CloudFactory建议,对于我们的任务,最好的结构是拥有一个由兼职标签人员组成的更大的团队,这是基于他们对抗任务疲劳和使用我们的用例产生更好质量的工作的经验。188金宝搏亚洲官网

这让我们质疑为什么我们没有受到来自其他团队的任何反对——毕竟,我们不是数据标签专家,他们才是!

4.价格- CloudFactory的定价很有竞争力——不是最便宜的,但也不是最贵的。我们从一开始就知道,我们并不是要寻找绝对便宜的选择,而是我们能够维持的最高质量的选择。我们很高兴看到,随着我们的承诺随着时间的推移而增长,定价将如何扩大。一些公司根据注释的数量定价,我们发现这很不寻常,因为对于一些需要精确、复杂注释的项目,我们预计每张图片需要10-15分钟的工作,而其他简单的任务可以在30秒内完成。CloudFactory的定价基于整个团队分配的时间,这更有意义——至少它是一个可控变量,因此我们可以相信,随着时间的推移,当我们在新的和不同的项目上工作时,它将支持不可避免的边缘情况。

外包数据标签时,要考虑长远

当您考虑为机器学习工作的外包培训数据生成时,我会鼓励您考虑长期。在Azavea,我们认为机器学习的价值主张是不是使用增量自动化产生短期收益。相反,将从采用机器学习技术中获得最大价值的公司将是那些将机器学习模型视为随着时间推移会变得更有价值的资产,而不是一投入生产就会贬值的资产的公司。

如果您正确地构建了一个与ml相关的计划,其中模型预测被反馈到您创建的标签和验证工作流中,那么您就有机会不断地重新校准您所使用的模型,并且,在理论上,复合了有效性(因此,你正在使用的模型和你用来训练他们的底层数据。如果这是您的方向,那么不被视为可信合作伙伴的兼职注释器的临时市场是没有意义的。相反,您应该寻找一种可靠的、持久的关系,这种关系可以随着您正在设计的ML软件中的良性循环而成长和成熟。

了解有关Azavea和我们的解决方案的更多信息,请访问www.azavea.com.

新的呼叫动作

消息影响采购文化与使命数据伙伴

通过订阅我们的博客获取CloudFactory的最新更新

Baidu