人工智能初创企业需要数据 其领导者应意识到许可私人数据复杂性

文 | AI国际站 唐恩

编 | 艾娃

由于其独特的监督,政府可以轻松获得大量数据。适当地使用这些可用数据,可以使他们创建有益的计划,以解决经济,政策,交通和公民生活方面的问题。不幸的是,大多数数据尚未开发。这是有关AI初创公司需要数据的事实,以及如何帮助政府。

人工智能初创企业需要数据 其领导者应意识到许可私人数据复杂性

但是,所有希望都不会丢失。好消息是,已经采取了一些举措来释放这些数据的力量。而且 ,许多行业的初创公司 已准备好利用这些丰富的数据来优化服务并解决对客户最重要的问题。

趋同趋势

由于数字化;收集和整理政府拥有的数据具有强大的职责。并且有更大的推动力,以使公众更容易访问这些数据。

各国政府正在复制这种趋势,使全世界的数据更易于访问。

重要的是要了解,制作数据可以激发就业机会的显着增长,公共部门的效率以及社会福利。在私有和学术领域,越来越多的公司投资于AI和机器学习,以新的方式解决复杂的问题。

数据助力AI

数据推动了AI的发展,但是监管机构和客户维护用户隐私的压力越来越大,导致公司(例如社交媒体巨头,产品评论网站和旅游公司)对共享大型客户数据集持谨慎态度。对于构建下一代AI工具的初创公司而言,这种情况提出了挑战。在这两个趋势的交汇处有一个有趣的机会。政府希望共享数据,而初创企业则需要该数据来推动技术创新。

完美的搭配是什么?

电信初创公司和政府机构可能看起来并不完美,但是现代初创公司已经具备了以有意义的方式利用政府数据的能力。通过利用政府数据,创业公司可以改善每个人的工作和生活条件,同时解决当前困扰社会的各种问题。

全部数据

美国政府拥有通过data.gov托管的200000多个公共数据集,这些数据集分为多个列表,并分为以下几类:

  • 有关纽约市1.73亿辆出租车的信息。
  • 过去100年的天气数据。
  • 墨西哥出生记录。
  • 美国政府采购数据。

房地产列表

也有像MLS房地产清单这样的半公开数据集。这些庞大且价格合理的汇总数据集对于希望转型传统机构或扰乱现有行业的初创公司很有用。

人工智能初创企业需要数据 其领导者应意识到许可私人数据复杂性

数据洞察力。

大多数公司,非营利组织和政府机构缺乏从数据中提取有用见解的技术技能。专门的AI初创公司并非如此,这些公司具有丰富的技能,但缺少机器学习工具所需的数据量。查找相关数据通常是这些团队面临的最困难的问题。

数据管理软件提供商Semarchy的CMO MichaelHiskey建议初创企业在开始开发AI解决方案之前先找到所需的数据。没有这些数据,解决方案将无法解决实际问题。一旦数据得到保护,重点应放在安全有效地使用它上。

虽然初创公司可以轻松地将目光投向特定数据集,但其领导者应意识到许可私人数据的复杂性。

通常,最好将时间花在从少量数据样本集或完全从另一个公共数据集中证明价值上来,以理清法律,价格,隐私和技术集成的时间。您总是可以稍后再获取更多数据,一旦初创企业可以提取见解,就更有可能让客户使用私有数据。

安全第一

数据所有者有责任汇总和匿名化他们的发现,尽管这并不意味着一切都是完全安全的。最近,麻省理工学院的一个城市规划人员和研究人员团队进行了一项研究,在该研究中,他们对数据集进行了匿名处理,其中包括“带有位置标记”的手机日志和新加坡用户产生的过境旅行。

在11周的时间里,该团队使用一种算法以95%的准确率将数据点与特定用户进行匹配。该示例显示了不良行为者通过将匿名数据集与自己的数据集合并来跟踪公民的过程是多么容易。

人工智能初创企业需要数据 其领导者应意识到许可私人数据复杂性

匿名化。

匿名化只是一种隐私保护措施,任何全面的安全策略都应附带严格的控制策略。

数据风险。

正如我们经常看到的那样,正确地处理数据并不是一件容易的事。企业必须尽力确保政府机构和私营部门机构认真承担这一责任。除了安全性,使用海量数据集还意味着在托管和带宽上花费大量资金。

幸运的是,主要的云提供商都提供了支持托管公共利益数据的程序,并且它们的访问机制使初创企业更容易上手。

兴趣范围

任何AI /机器学习工作的绝大多数工作都涉及理解,清理和转换数据。除了清理数据之外,初创公司还必须与相关政府机构的专家紧密合作,以了解如何解释数据集。

各国政府多年的经验将加快获取见解的过程。毕竟,人工智能/机器学习仍然是最能用来增强而非替代人类智能的工具。

新兴数据集-新兴公司。

新兴公司可以在几乎可以想象的每个领域中使用许多数据集。在优化要解决的问题时,人工智能和机器学习非常有用。与简单的启发式问题解决方法相比,所有这些技术都具有巨大的优势。

医疗保健部门。

当涉及到挽救生命时,这就是我们想要的。这就是为什么公共卫生与安全代表着AI推动的初创企业特别令人兴奋的领域。

在医疗保健领域,我们将看到公司在优化紧急呼叫响应等方面帮助取得重大突破。

与政府数据配对使用时,认识到对关键基础设施的环境威胁,并改进缓解虫害和疾病扩散的策略,无疑可以使数据,人工智能和机器学习解决方案的增长。

许多公司已经使用政府数据来改善公众的整体健康和安全。CentralSquare Technologies是一家AI初创公司,可将大约5000个紧急呼叫中心与美国大都市地区的患者建立联系。CentralSquare在呼叫者需要其家乡代码以外的帮助时缩短报警响应时间。

Geospiza于2017年推出,使用气候数据分析来帮助紧急情况管理人员和民选官员在灾难情况下挽救生命。Geospiza还可以帮助气候敏感行业的公司做出更明智的风险决策。名为Citizen的公司结合了人类员工和AI技术,直接从警察扫描仪和其他来源获取信息,以警告附近的居民发生事件或潜在威胁。

许多地方政府没有完善的数据策略,这会抑制每个人的机会。Stae的团队通过帮助包括亚特兰大和新泽西州泽西市在内的市政府改善其数据仓库解决方案来解决此问题。

人工智能初创企业需要数据 其领导者应意识到许可私人数据复杂性

很多初创公司已经利用了数据,但是还有很多未开发的机会。

无论您有一个想法可以挽救生命,还是一个可以帮助某人节省一点时间的想法,政府都可能拥有可以帮助您的数据。让所有这些都浪费掉是可耻的。


分享到:


相關文章: