人工智能初創企業需要數據 其領導者應意識到許可私人數據複雜性

文 | AI國際站 唐恩

編 | 艾娃

由於其獨特的監督,政府可以輕鬆獲得大量數據。適當地使用這些可用數據,可以使他們創建有益的計劃,以解決經濟,政策,交通和公民生活方面的問題。不幸的是,大多數數據尚未開發。這是有關AI初創公司需要數據的事實,以及如何幫助政府。

人工智能初創企業需要數據 其領導者應意識到許可私人數據複雜性

但是,所有希望都不會丟失。好消息是,已經採取了一些舉措來釋放這些數據的力量。而且 ,許多行業的初創公司 已準備好利用這些豐富的數據來優化服務並解決對客戶最重要的問題。

趨同趨勢

由於數字化;收集和整理政府擁有的數據具有強大的職責。並且有更大的推動力,以使公眾更容易訪問這些數據。

各國政府正在複製這種趨勢,使全世界的數據更易於訪問。

重要的是要了解,製作數據可以激發就業機會的顯著增長,公共部門的效率以及社會福利。在私有和學術領域,越來越多的公司投資於AI和機器學習,以新的方式解決複雜的問題。

數據助力AI

數據推動了AI的發展,但是監管機構和客戶維護用戶隱私的壓力越來越大,導致公司(例如社交媒體巨頭,產品評論網站和旅遊公司)對共享大型客戶數據集持謹慎態度。對於構建下一代AI工具的初創公司而言,這種情況提出了挑戰。在這兩個趨勢的交匯處有一個有趣的機會。政府希望共享數據,而初創企業則需要該數據來推動技術創新。

完美的搭配是什麼?

電信初創公司和政府機構可能看起來並不完美,但是現代初創公司已經具備了以有意義的方式利用政府數據的能力。通過利用政府數據,創業公司可以改善每個人的工作和生活條件,同時解決當前困擾社會的各種問題。

全部數據

美國政府擁有通過data.gov託管的200000多個公共數據集,這些數據集分為多個列表,並分為以下幾類:

  • 有關紐約市1.73億輛出租車的信息。
  • 過去100年的天氣數據。
  • 墨西哥出生記錄。
  • 美國政府採購數據。

房地產列表

也有像MLS房地產清單這樣的半公開數據集。這些龐大且價格合理的彙總數據集對於希望轉型傳統機構或擾亂現有行業的初創公司很有用。

人工智能初創企業需要數據 其領導者應意識到許可私人數據複雜性

數據洞察力。

大多數公司,非營利組織和政府機構缺乏從數據中提取有用見解的技術技能。專門的AI初創公司並非如此,這些公司具有豐富的技能,但缺少機器學習工具所需的數據量。查找相關數據通常是這些團隊面臨的最困難的問題。

數據管理軟件提供商Semarchy的CMO MichaelHiskey建議初創企業在開始開發AI解決方案之前先找到所需的數據。沒有這些數據,解決方案將無法解決實際問題。一旦數據得到保護,重點應放在安全有效地使用它上。

雖然初創公司可以輕鬆地將目光投向特定數據集,但其領導者應意識到許可私人數據的複雜性。

通常,最好將時間花在從少量數據樣本集或完全從另一個公共數據集中證明價值上來,以理清法律,價格,隱私和技術集成的時間。您總是可以稍後再獲取更多數據,一旦初創企業可以提取見解,就更有可能讓客戶使用私有數據。

安全第一

數據所有者有責任彙總和匿名化他們的發現,儘管這並不意味著一切都是完全安全的。最近,麻省理工學院的一個城市規劃人員和研究人員團隊進行了一項研究,在該研究中,他們對數據集進行了匿名處理,其中包括“帶有位置標記”的手機日誌和新加坡用戶產生的過境旅行。

在11周的時間裡,該團隊使用一種算法以95%的準確率將數據點與特定用戶進行匹配。該示例顯示了不良行為者通過將匿名數據集與自己的數據集合並來跟蹤公民的過程是多麼容易。

人工智能初創企業需要數據 其領導者應意識到許可私人數據複雜性

匿名化。

匿名化只是一種隱私保護措施,任何全面的安全策略都應附帶嚴格的控制策略。

數據風險。

正如我們經常看到的那樣,正確地處理數據並不是一件容易的事。企業必須盡力確保政府機構和私營部門機構認真承擔這一責任。除了安全性,使用海量數據集還意味著在託管和帶寬上花費大量資金。

幸運的是,主要的雲提供商都提供了支持託管公共利益數據的程序,並且它們的訪問機制使初創企業更容易上手。

興趣範圍

任何AI /機器學習工作的絕大多數工作都涉及理解,清理和轉換數據。除了清理數據之外,初創公司還必須與相關政府機構的專家緊密合作,以瞭解如何解釋數據集。

各國政府多年的經驗將加快獲取見解的過程。畢竟,人工智能/機器學習仍然是最能用來增強而非替代人類智能的工具。

新興數據集-新興公司。

新興公司可以在幾乎可以想象的每個領域中使用許多數據集。在優化要解決的問題時,人工智能和機器學習非常有用。與簡單的啟發式問題解決方法相比,所有這些技術都具有巨大的優勢。

醫療保健部門。

當涉及到挽救生命時,這就是我們想要的。這就是為什麼公共衛生與安全代表著AI推動的初創企業特別令人興奮的領域。

在醫療保健領域,我們將看到公司在優化緊急呼叫響應等方面幫助取得重大突破。

與政府數據配對使用時,認識到對關鍵基礎設施的環境威脅,並改進緩解蟲害和疾病擴散的策略,無疑可以使數據,人工智能和機器學習解決方案的增長。

許多公司已經使用政府數據來改善公眾的整體健康和安全。CentralSquare Technologies是一家AI初創公司,可將大約5000個緊急呼叫中心與美國大都市地區的患者建立聯繫。CentralSquare在呼叫者需要其家鄉代碼以外的幫助時縮短報警響應時間。

Geospiza於2017年推出,使用氣候數據分析來幫助緊急情況管理人員和民選官員在災難情況下挽救生命。Geospiza還可以幫助氣候敏感行業的公司做出更明智的風險決策。名為Citizen的公司結合了人類員工和AI技術,直接從警察掃描儀和其他來源獲取信息,以警告附近的居民發生事件或潛在威脅。

許多地方政府沒有完善的數據策略,這會抑制每個人的機會。Stae的團隊通過幫助包括亞特蘭大和新澤西州澤西市在內的市政府改善其數據倉庫解決方案來解決此問題。

人工智能初創企業需要數據 其領導者應意識到許可私人數據複雜性

很多初創公司已經利用了數據,但是還有很多未開發的機會。

無論您有一個想法可以挽救生命,還是一個可以幫助某人節省一點時間的想法,政府都可能擁有可以幫助您的數據。讓所有這些都浪費掉是可恥的。


分享到:


相關文章: