小薑雜談:CAPTCHA
文章分類: 特色玩意

早期的 CAPTCHA 很簡單,大多就是在一個比較雜亂的背景上有幾個英文字母,要求使用者將字母寫出來。但隨著電腦判斷、解析的演算法愈來愈進步,創造 CAPTCHA 的這一方也不得不努力,將 CAPTCHA 設計得愈來愈複雜難明...直到連人類都快要辨識不出來的地步 orz。
電腦辨識圖片一共有三個步驟:
- 消去背景
- 切割元素
- 辨認元素

上圖的這個 EZ-Gimpy 產生的 CAPTCHA 就用了一個漸層的背景和扭曲的文字來讓電腦辨識困難。事實上,以現代技術來說,這差不多是最容易破解的一種了 -- 電腦就是消去背景和辨認元素這兩個部份最擅長,因此要讓電腦辨識困難點,還必須要加上切割元素的困難度才行。


上圖的這種 CAPTCHA 叫 reCAPTCHA,是一個使用率還蠻高的 CAPTCHA。reCAPTCHA 用的技術很有趣:它是去掃瞄古書,並從中找出電腦無法辨認出來的古字,加上一條增加切割元素困難度的曲線後,呈現給使用者。系統只知道兩個字當中其中一個的答案,如果你答對了它知道的那個,那它就假設你是人類無誤,並假設你的另外一個字也有答對,這樣 reCAPTCHA 知道的字就又多一個了。

KCAPTCHA 則是讓所有的字都黏在一起,讓電腦無法正確地切割元素。

這是一個利用背景和前景的複雜度來增加辨試困難度的例子。不過總覺得這比扭曲的字還虐待人啊 = =。


這個系統叫「KittenAuth」,顧名思議就是要你從九張可愛的動物中選出三張是貓咪的圖來。這個利用的是電腦對沒有固定模式的東西(像照片)的內容沒轍的這點。另外一種 CAPTCHA 完全捨棄了圖片,只問一個大概只有人類才答得出來的問題,例如:




「請以 PGN 格式,回答執白者的最佳下一步」



雖然不多見,但也有些網站用的是動畫的 CAPTCHA。這種對電腦來說幾乎是不可能破解的,因為電腦很難知道哪個影格裡的資料是正確的。當然,也不一定要靠文字才能做 CAPTCHA,像下面這個:

這個系統叫「KittenAuth」,顧名思議就是要你從九張可愛的動物中選出三張是貓咪的圖來。這個利用的是電腦對沒有固定模式的東西(像照片)的內容沒轍的這點。另外一種 CAPTCHA 完全捨棄了圖片,只問一個大概只有人類才答得出來的問題,例如:
- 浴缸裡裝滿了熱__。
- 癮科技最帥的編輯是__。




「請以 PGN 格式,回答執白者的最佳下一步」






讀者回應 (第 1 頁 / 共 2 頁)
Unknown @ Mar 30th 2009 12:19AM
我覺得你這篇好像發過...有一次還用恐龍妹九宮格,問哪一個是最辣的!
Samael @ Mar 30th 2009 12:19AM
超討厭這種東西的,根本就看不懂它在鬼畫符什麼。而且視障人士怎麼辦?
123 @ Mar 30th 2009 1:47AM
有語音的
Sunny @ Mar 30th 2009 9:16AM
語音的我曾故意用過,對視障者難以帶來用途:
- 語音的來源明顯是來自像電視、畫面的對白內容,故意夾雜背景聲音…
- 因為這個緣故,口音、語速語調次次不同,即使精通英文也未必正確猜到
- 我試過的數個滿奇怪的,一句語音出現逾二十字的句子,我聽也聽不到囧
- 那語音專為 English Native Speaker 而設,換言之英文沒到那個水準的人也休想用得到…
換句話說… 語音CAPTCHA是適合聆聽考試前練習之用(?)
honeybee @ Mar 30th 2009 12:26AM
reCAPTCHA 的運作模式真巧妙,無形之中還幫忙做好事
各取所需,而且恰到好處哩
Archy @ Mar 30th 2009 12:32AM
記得還有一種是問你哪個妞比較辣的
albertpkmn @ Mar 30th 2009 1:34AM
"癮科技最帥的編輯是__"
不知道
Samael @ Mar 30th 2009 9:40AM
Ans: φ, empty set.
cafiur @ Mar 30th 2009 7:25AM
原來 Turing test 的中文名稱叫「圖靈測試」。 (筆記)
a85515711 @ Mar 30th 2009 1:44AM
問題:誰把自己的眉毛燒掉過,並且說了Am I missing... an eyebrow?
1.亞當沙維奇
2.傑米海納曼
3.托瑞貝勒奇
4.凱莉拜倫
5.格蘭今原
6.老兄
(XD
遙想當年在模擬藏連結藏密碼的回憶(?(故意把文字設定成和底色相同顏色,必須框選才看的到..
philipz @ Mar 30th 2009 2:06AM
1.亞當沙維奇
Rex @ Mar 30th 2009 2:11AM
西洋棋不會下怎麼辦???
Jack @ Mar 30th 2009 2:33AM
結果到最後,
這個機制到底是為難人類還是防止電腦啊昏(我曾經有花1個小時以上註冊的經驗)
kuo @ Mar 30th 2009 2:44AM
倒數第二張圖的題目是什麼?
會不會有一天連「納瓦荷」這種據說唯一沒被日軍破譯的密碼都上場?
mechman @ Mar 30th 2009 6:04AM
忘記那部電影裡面講的「納瓦荷」的由來,是不是什麼夏威夷人的土話之類的?
但是我在墨西哥倒是接觸到很接近的東西,叫做 nahuatl,其實是來自阿茲提克人 (Aztec) 的古老語言,在墨西哥很多大學裡面還有專人在教學這個語言。
六百 @ Mar 30th 2009 9:39AM
那瓦荷是美國印地安的一族
印象中是現存最大(還是第二大?)的美國原住民
kuo @ Mar 30th 2009 9:43AM
是電影《Windtalkers 追風戰士, 2002 》,導演吳宇森。另外,這個特殊密碼也是《X檔案》電視影集的主要素材之一。
納瓦荷(Navajo)是美洲印第安原住民,主要居住在美國亞歷桑納州,二戰及韓戰期間納瓦荷族人主要在美軍部隊中擔任codetalkers。
Aztec人是美洲原住民,語言有可能跟Navajo族有些關係。
bostus @ Mar 30th 2009 3:09AM
華人世界為什麼不能用漢字驗證碼?
怕不知道發音嗎?例如:槑
六百 @ Mar 30th 2009 9:40AM
其實我也看過用漢字/華文的 captcha
IUknown @ Mar 30th 2009 5:01AM
動畫的也可以破解阿,只要有規則就能破解,以那張轉圈圈的字來說,假設他字都是這種形式,很顯然轉到最前面那張才是正確的,也就是顏色最亮,體積佔最大的,其它的當垃圾丟掉就可以了