自己開發通用圖像標識符的上手指南!

你可能熟悉電視節目《硅谷》中"熱狗"這一集,在這一集中演員們創建了一個應用程序來簡單地(並且很有趣地)確定對象是不是"熱狗"。現在這個應用程序不再是科幻小說般的存在的了。越來越多像Google Lens這樣的應用已經擴展到到大多數現代智能手機上。如今,任何人都可以簡單地用相機快速獲取所需的信息。

同時,像Google Cloud Vision API、AWS Rekognition和Clarifai這樣的服務不再僅侷限於服務少數人。這些服務可讓你以更少的代碼實現更多功能。即便它不免費也深受大家喜愛。此外,它是一個通用的圖像標識符,可能有不同的用例。

輸入:TensorFlowJS

自己開發通用圖像標識符的上手指南!

這是由谷歌大腦團隊發佈的JavaScript庫,可為每個人帶來機器學習。它最初是用Python、C ++和CUDA編寫的 多虧了這個團隊,他們將它移植到瀏覽器常用的JavaScript中。雖然TensorFlowJS與他的兄弟Python版本並不完全相同,但該庫已經配備了必要的API以從頭開始構建和訓練模型,運行TensorFlow模型並重新訓練原有模型,這一切都是瀏覽器的便利之處。

發現之路

自己開發通用圖像標識符的上手指南!

來自不同來源的警告表明,如果你沒有任何機器學習背景,TensorFlow將不會對你有所幫助。Python成為開發機器學習的首選語言,你似乎需要學習基礎知識才能繼續進行開發。這是作者遇到的眾多障礙之一。但作者仍然決定創建自己的圖像標識符。

警告:如果你沒有任何機器學習基礎,TensorFlow不適合你

找到了尋找表情符號的存儲庫並花費數小時對代碼進行反向工程以滿足作者的需求後,作者終於可以創建自己的圖像分類器,並能夠在客戶端順利運行。

認真對待

作者認為自己最大的障礙是在Python開發。作者最初是在Windows環境中開發的,設置起來很麻煩。但是當作者切換到Mac環境時,一切都很順利。作者學到的最大教訓是為系統提供了良好的數據。作者的同事告訴他,為了獲得高準確度的結果,你必須提供良好的初始數據。

自己開發通用圖像標識符的上手指南!

簡單地理解機器學習是如何工作的一個形象的類比是,通過將圖像比作一個2歲的孩子來進行教學,其中數據是一組圖像,而2歲的是機器學習系統。例如,如果你想要孩子知道蘋果是什麼,你只能給孩子展示不同的蘋果圖片。圖中沒有其他的東西,沒有其他的水果,沒有其他的元素。在孩子看過一定數量的照片後,他們將能夠知道在現實生活中什麼時候會看到蘋果。另一方面,如果你給孩子看一些蘋果和橘子、蘋果和香蕉、蘋果和葡萄組合在一起的圖片。當他們看到這些水果在一起時,孩子們就會感到困惑。

這種類比的寓意是,最初輸入到機器學習的圖像應該是對於不知道主題是什麼的人和物來說很容易理解的。

PWA猜謎

自己開發通用圖像標識符的上手指南!

“猜出這個謎語

從帽子裡取出的隨機謎語

當你知道答案時,請立即採取措施

如果你是對的,我會給你鼓掌"

作者的目標是設計出自己的圖像標識符,並將其用於更好的用途。 The Riddle Me是一個PWA,它會向你展示你家中可以找到的普通物品的隨機謎語。你的挑戰是找到它的答案並拍攝照片。 如果你是正確的,你繼續猜其他的謎語。如果你猜錯了,那就繼續猜下去吧。


分享到:


相關文章: