江溪中文 > 重生之AI教父 > 第189章 191. 驗證碼在剝削什么

      第189章 191. 驗證碼在剝削什么

          此舉,是為了獲取海量的帶標簽數據,為自己后來的人工智能做準備。一半驗證你是不是真人,有沒有認真答題;另一半,則開始讓你義務勞動打白工。

          標注門牌號,路牌,分類各種圖片,只要你生活在網絡的世界,你就或多或少地每天要給谷歌打幾十秒的白工。

          “所以說,雖然驗證碼誕生之初,解決了網絡環境和用戶安全的大問題,但后面其實性質已經發生了改變?”

          “那當然,如果真的要做【分辨對面到底是人是狗】的圖靈測試,其實還有更加聰明的辦法,比如只需要點擊一個我不是機器人的按鈕就好了。”

          “系統可以追蹤用戶的鼠標和鍵盤軌跡,讓機器人的模擬成本非常之高,這才是更科學的驗證系統。又或者是滑動,拼圖的方式,都比驗證碼科學多了,又不會有識別錯誤的風險,比如8和B,o和0。至于那些圖像的測試驗證,其實更多的成為了一種收集數據的手段。”

          這方面的內容確實是孟繁岐以前未曾關注過的。

          他倒也注意到過,有時候自己胡亂點驗證碼,竟然也能通過。曾經懷疑過這里面的問題,但沒有多想,也沒有仔細研究過里面的原理。

          更沒想到,這個系統竟然收集了如此海量的數據,幾年的時間就錄入了數千萬的書籍。

          “現在這些扭曲的文字也不大行了,經過四五年的持續驗證碼標注,現在機器識別那些扭曲文字的準確率接近100,人類自己反而只有三四十的準確度。”

          伊利亞笑著說道,這個數據是他們今年年初剛剛測試得到的。

          “因此這種傳統的錄入單詞的方式,現在也已經不夠安全了。”

          “驗證碼說得高大上一點,就是圖靈測試的一種,確實在設計之初,就很難避免它有利于人工智能的本質。”

          孟繁岐仔細想了下,覺得很合理,驗證碼的本意就是區分機器和人類。機器通過學習這些行為,自然能夠在這方面越來越強。

          “這個【我不是機器人】,看上去只需要點一下的功能,也不是你想的那么簡單。它會追蹤你點擊驗證框之前、當時和之后的行為,比如在網頁上花費的時間和瀏覽的方式,從而來判斷是否是人為操作。”

          這個孟繁岐倒是稍微了解一點,谷歌后來甚至推出了更加全新的reCAPTCHAv3,這個第三版本的測試方式連一個選框都不需要你去點。

          只不過,它會持續在后臺分析你瀏覽網站的方式,并根據種種行為和依據來給你評分。

          倘若你的得分過低,你就會看到熟悉的驗證碼彈窗,來確定你是不是人類。

          在谷歌看來,這是最好的體驗,用戶不需要任何輸入,甚至不會意識到自己已經通過了人機的驗證,而且它很難被破解程序學習。