របៀបធ្វើសាប៊ូកក់សក់ ស្គាល់ url ដោយស្វ័យប្រវត្តិ។ ការទទួលស្គាល់ការការពារ captcha

ខ្ញុំនឹងបង្ហាញបច្ចេកទេសទាំងនេះនៅលើ captcha ពិសោធន៍។ ក្នុងនាមជាប្រធានបទសាកល្បង ខ្ញុំបានជ្រើសរើស captcha នៃ Rafontes ជាក់លាក់មួយ ដែលខ្ញុំបានឆ្លងកាត់នៅពេលដែលខ្ញុំកំពុងស្វែងរកសម្ភារៈសម្រាប់អត្ថបទមុន។

ឧទាហរណ៍នៃ captcha ដែលបានបង្កើត៖

ខ្ញុំ​ត្រូវ​ប្រើ​ផ្ទៃ​ខាង​ក្រោយ​ផ្សេង​ពី​ព្រោះ​អ្នក​និពន្ធ​មិន​បាន​បង្ហោះ​ដើម (ឬ​ខ្ញុំ​រក​មិន​ឃើញ) ប៉ុន្តែ​វា​នឹង​មិន​ប៉ះពាល់​ដល់​លទ្ធផល​ទេ។

ដំណើរការមុន។

ជាលទ្ធផលនៃសកម្មភាពនេះយើងនឹងទទួលបានតំបន់ច្រឹបច្រើនបំផុត រូបភាព monochromeជាមួយអត្ថបទ។

ដំបូងយើងត្រូវការ ផ្ទៃខាងក្រោយដាច់ដោយឡែកពីអត្ថបទ. យើងវិភាគរូបភាព និងកូដបង្កើតរូបភាព។ កំហុសដំបូងគឺជាក់ស្តែង៖

  • ប្រើពណ៌មួយសម្រាប់ការធ្វើតេស្តកូដទាំងមូល
  • ពណ៌សម្រាប់អត្ថបទត្រូវបានបង្កើតក្នុងជួរ rand(0, 200), 0, rand(0, 200) សម្រាប់ R G B រៀងគ្នា (វាគ្រប់គ្រាន់ក្នុងការជ្រើសរើសពណ៌តែក្នុងជួរនេះប៉ុណ្ណោះ)
  • ផ្ទៃខាងក្រោយជាមួយ មួយចំនួនធំពណ៌ផ្សេងគ្នា (នឹងមិនប៉ះពាល់ដល់ស្ថិតិនៃពណ៌ដែលប្រើញឹកញាប់បំផុត)

ឥឡូវនេះ ដោយផ្អែកលើការពិតទាំងនេះ យើងវិភាគពណ៌នៃភីកសែលនីមួយៗនៅក្នុងរូបភាពទាំងមូល ហើយជ្រើសរើសមួយដែលប្រើញឹកញាប់បំផុត។ វាប្រែចេញ ៨C០០៧៤(ក្នុងទម្រង់ hex) ។ យើងកំណត់កំហុសតូចមួយពីវា ហើយជ្រើសរើសពណ៌នេះ និងពណ៌ស្រដៀងនឹងវាបន្តិច ដោយគិតគូរពីកំហុស។ យើងលាបពណ៌ដែលបានជ្រើសរើសទាំងអស់ដោយពណ៌ខ្មៅ នៅសល់ពណ៌ស។ វាប្រែចេញរូបភាពនេះ៖

ដូចដែលអ្នកអាចមើលឃើញ យើងបានទទួលអត្ថបទដោយស្ទើរតែគ្មានការបង្ខូចទ្រង់ទ្រាយ។ ពិតហើយ នៅសល់តែបន្ទាត់មួយប៉ុណ្ណោះ ប៉ុន្តែយើងមានក្បួនដោះស្រាយការកាត់តម្រឹមដ៏លំបាកមួយ (បន្ថែមលើវាខាងក្រោម) ដែលបន្ទាត់នេះមិនអាចមានឥទ្ធិពលបានទេ។

ឥឡូវនេះ ជ្រើសរើសតំបន់ដែលមានលេខកូដ.
ដោយសារអត្ថបទរបស់យើងគឺជាចំណុចងងឹតបំផុត យើងកំពុងព្យាយាមស្វែងរកកន្លែងនេះតាមវិធីដោះស្រាយ។ ដំបូងយើងកំណត់ព្រំដែនផ្ដេក៖

ឥឡូវនេះយើងកំណត់ព្រំដែនបញ្ឈរ៖

ខ្សែនេះនៅតែនៅទីនេះ ព្រោះតំបន់នោះនៅតែត្រូវបានយល់ឃើញដោយមុខងារថាជាតំបន់ងងឹតខ្លាំង។ ប៉ុន្តែឥឡូវនេះ ដោយផ្អែកលើព្រំដែនទាំងនេះ យើងកែលម្អពួកវាជារង្វង់ទីពីរ ផ្ដេក៖

ហេតុអ្វី​បាន​ជា​បន្ទាត់​នេះ​ត្រូវ​បាន​ដក​ចេញ​ឥឡូវ​នេះ អ្នក​សួរ? ដោយសារតែឥឡូវនេះ "ជួរឈរនៃភីកសែល" តិចជាងនេះត្រូវបានវិភាគ ហើយនៅពេលវិភាគដោយក្បួនដោះស្រាយ វាត្រូវបានគេបង្ហាញថានៅក្នុងតំបន់នេះមានជួរឈរច្រើនពេកដែលមានភីកសែលខ្មៅមួយ ដូច្នេះហើយនេះគឺជាសំឡេងរំខាន។ ឥឡូវ​នេះ​សូម​បញ្ជាក់​ពី​ស៊ុម​បញ្ឈរ៖

ដោយសារ​ផ្ទៃ​និយមន័យ​បាន​តូច​ជាង​មុន ឥឡូវ​បន្ទាត់​ដែល​មាន​សំឡេង​រំខាន​បាន​ក្លាយ​ជា​ចំណុច​ងងឹត​មិន​គ្រប់គ្រាន់ ហើយ​ត្រូវ​បាន​ដក​ចេញ​ទាំង​ស្រុង។ ដូច្នេះយើងទទួលបានផ្នែកមួយដែលមានអត្ថបទ។ ជា​ការ​ពិត​ណាស់ ក្បួន​ដោះស្រាយ​នេះ​ពេល​ខ្លះ​មិន​បាន​ត្រឹម​ត្រូវ​ជ្រើសរើស​ផ្ទៃ​ដែល​ចង់​បាន។ ប៉ុន្តែយោងទៅតាមការធ្វើតេស្តរបស់ខ្ញុំចំនួននៃនិយមន័យមិនត្រឹមត្រូវមិនលើសពី 5% ដែលពិតជាអាចត្រូវបានគេមិនយកចិត្តទុកដាក់។

ការបែងចែក

ឥឡូវនេះភារកិច្ចរបស់យើងគឺបំបែករូបភាពលទ្ធផលទៅជា តំបន់ដាច់ដោយឡែកជាមួយនិមិត្តសញ្ញា។

ជាការពិតណាស់ អ្នកអាចគណនា រកមើលព្រំដែនតួអក្សរ។ល។ ប៉ុន្តែប្រសិនបើអ្នកវិភាគកូដជំនាន់ម្តងទៀត អ្នកអាចរកឃើញកំហុសមួយទៀត។

  • ចន្លោះរវាងតួអក្សរនីមួយៗគឺតែងតែ 15 ភីកសែល

ជាការពិតណាស់ ពេលខ្លះដោយសារតែទំហំនៃនិមិត្តសញ្ញា ពួកវាលើសពីដប់ប្រាំភីកសែល បន្ទាប់មកអ្នកត្រូវខាំមួយ ឬពីរភីកសែលផ្សេងទៀតពីនិមិត្តសញ្ញាជិតខាង។ ប៉ុន្តែនេះមិនសំខាន់ទេ។ ជាទូទៅ ចូរយើងបំបែករូបភាព៖

ឥឡូវនេះ ដូចដែលយើងឃើញមានផ្ទៃទទេនៅជុំវិញនិមិត្តសញ្ញាមួយចំនួន។ ប៉ុន្តែយើងនៅតែត្រូវការនិមិត្តសញ្ញាខ្លួនឯង។ យើងប្រើមុខងារច្រឹបសម្រាប់តួអក្សរនីមួយៗ ហើយសមនឹងរូបភាពលទ្ធផលទៅជាចតុកោណដែលវាស់ 17x27៖

វាគឺជារូបភាពទាំងនេះដែលនឹងត្រូវបានដាក់ជូនជាលក្ខណៈបុគ្គលសម្រាប់ការទទួលស្គាល់។

ការទទួលស្គាល់

យើងនឹងអនុវត្តការទទួលស្គាល់ដោយគ្មានបណ្តាញសរសៃប្រសាទដែលបង្កើតថ្មី។ ហេតុអ្វី? តួនាទីសម្រេចចិត្តត្រូវបានលេងដោយការពិតដែលថាមិនមានបណ្ណាល័យសក្ដិសមតែមួយសម្រាប់វីនដូទេ។ យើងនឹងប្រើការសម្គាល់របាំងតួអក្សរធម្មតា។

ដើម្បីធ្វើដូចនេះយើងមានសិទ្ធិចូលប្រើ កូដប្រភពបង្កើតរូបភាពសខ្មៅជាច្រើនសម្រាប់និមិត្តសញ្ញានីមួយៗដែលមានមុំបង្វិលខុសៗគ្នា (ពីពីរទៅបួនដឺក្រេ) និង ទំហំផ្សេងគ្នាពុម្ពអក្សរ (ពី 20pt ដល់ 30pt) ។ រូបភាពលទ្ធផលនីមួយៗ ដូចដែលអ្នកបានទាយ សមនឹងរាងចតុកោណកែងដែលវាស់ 17x27។ រូបភាពលទ្ធផលនីមួយៗត្រូវបានគេហៅថារបាំង។

សម្រាប់អក្សរនីមួយៗខ្ញុំបង្កើតរបាំង 10-15 ។ ជាគោលការណ៍នេះគឺគ្រប់គ្រាន់ហើយ ប៉ុន្តែប្រសិនបើអ្នកបង្កើនចំនួនរបាំងមុខ អ្នកអាចបង្កើនភាគរយនៃការទទួលស្គាល់។

ជាទូទៅ រូបភាពទាំងអស់ដែលបានបញ្ជូនទៅកាន់ការបញ្ចូលគឺត្រូវបានប្រៀបធៀបជាមួយនឹងរបាំងមុខ ហើយក្បួនដោះស្រាយកំណត់ថារបាំងណាដែលត្រូវនឹងរូបភាពរបស់យើងល្អបំផុត ដោយផ្អែកលើចំណុចនេះ ធ្វើការសន្និដ្ឋានអំពីតួអក្សរអ្វីដែលត្រូវបានសរសេរនៅក្នុងរូបភាព។

លទ្ធផល

សម្រាប់​ការ​ធ្វើ​តេស្ត ខ្ញុំ​បាន​ទទួល​តួអក្សរ​គ្មាន​សំឡេង​ចំនួន ២០០ ដោយ​បង្កើត​រូបភាព​មួយ ហើយ​បែងចែក​វា​ជា​និមិត្តសញ្ញា។ ហើយខ្ញុំបានដំណើរការការធ្វើតេស្តតាមកម្មវិធី។ និងការយកចិត្តទុកដាក់!
លទ្ធផល៖ ជោគជ័យ៖ ១៧២ កំហុស៖ ២៨ ភាគរយ៖ ៨៦ ភាគរយ
នោះគឺតួអក្សរនីមួយៗនៅក្នុង captcha នឹងត្រូវបានទទួលស្គាល់ដោយជោគជ័យជាមួយនឹងប្រូបាប៊ីលីតេនៃ 86% !

គណិតវិទ្យាបន្តិច។ តោះគណនាភាគរយនៃប្រូបាប៊ីលីតេនៃការទទួលស្គាល់ captcha ជោគជ័យ៖
សម្រាប់ 4 តួអក្សរ៖ 0.86^4= 54%
សម្រាប់ 5 តួអក្សរ៖ 0.86^5= 47%

ជាមធ្យម រាល់វិនាទី captcha នឹងត្រូវបានទទួលស្គាល់ដោយជោគជ័យ។

ដោយពិចារណាថា captcha នីមួយៗចំណាយពេលប្រហែល 1 វិនាទី ហើយជាមធ្យម 2 វិនាទីនឹងត្រូវបានទាមទារសម្រាប់ការទទួលស្គាល់ដោយជោគជ័យ។ នេះគឺជាលទ្ធផលដ៏អស្ចារ្យណាស់។

ប្រភព

ស្គ្រីបបង្កើត និងទទួលស្គាល់ captcha ដោយខ្លួនឯង។ ឧទាហរណ៍នៃស្គ្រីបនៅក្នុងរូបភាពដែលបានផ្តល់ឱ្យជាឧទាហរណ៍ដោយអ្នកនិពន្ធនៃ captcha:

(រូបភាពអាចចុចបាន)

នៅលើទំព័រនេះខ្ញុំនឹងប្រាប់អ្នកអំពីប្រភេទមួយផ្សេងទៀតនៃការរកប្រាក់នៅលើអ៊ីនធឺណិត - បញ្ចូល captcha ដើម្បីប្រាក់។ ខ្ញុំបានរៀបចំបញ្ជីនៃគេហទំព័រពេញនិយមបំផុតសម្រាប់ការរកលុយដោយបញ្ចូល captcha ។ សេវាកម្មទាំងនេះក៏អាចមានប្រយោជន៍សម្រាប់ធ្វើការជាមួយផងដែរ។ កម្មវិធីផ្សេងៗដើម្បីប្រើប្រឆាំងនឹង captcha ។

ខ្ញុំ​គិត​ថា​វា​គ្មាន​ន័យ​អ្វី​ទេ​ក្នុង​ការ​ប្រាប់​ថា captcha គឺ​ជា​អ្វី :) យើង​ឃើញ​រឿង​នេះ​គ្រប់​ទីកន្លែង។ ប៉ុន្តែប្រហែលជាមិនមានមនុស្សជាច្រើនដឹងពីអ្វីដែលពួកគេរកបានពីនេះទេ។

រកប្រាក់ដោយបញ្ចូល captcha

ជាការប្រសើរណាស់, ប្រសិនបើអ្នកបានប្រើកម្មវិធីណាមួយ (កម្មវិធី) សម្រាប់មួយចំនួន សកម្មភាពដោយស្វ័យប្រវត្តិនៅលើអ៊ីនធឺណិត ជាធម្មតាមានធាតុម៉ឺនុយសម្រាប់បញ្ចូលគ្រាប់ចុចប្រឆាំង captcha គ្រប់ទីកន្លែង។

សោនេះត្រូវបានចេញដោយសេវាកម្មទទួលស្គាល់ captcha កំឡុងពេលបង់ប្រាក់។ គ្រាប់ចុចជាធម្មតាមើលទៅដូចជាស៊េរីអក្សរ និងលេខ។ អ្នកបញ្ចូលកូនសោនេះទៅក្នុងកម្មវិធី ហើយសេវាកម្មនឹងស្គាល់អ្នកសម្រាប់ចំនួនទឹកប្រាក់ដែលអ្នកដាក់។

ដូច្នេះ តើអ្នកគិតថាអ្នកណាខ្លះដែលទទួលស្គាល់ការបង្ក្រាបទាំងនេះនៅក្នុងសេវាកម្មទាំងនេះ🙂 អ្នកគ្រប់គ្រងពីរបីនាក់?... ហើយតើពួកគេប៉ុន្មាននាក់នឹងអាចទទួលស្គាល់បាន?.. ជាការពិតណាស់មិនមែនទេ។ ពួកគេជ្រើសរើសកម្មករដែលអង្គុយដោះស្រាយល្បែងផ្គុំរូប ហើយទទួលបានប្រាក់ខែ។

ប្រសិនបើអ្នកចាប់អារម្មណ៍លើប្រភេទនៃការរកប្រាក់ចំណូលនេះ បន្ទាប់មកជ្រើសរើសសេវាកម្មសម្រាប់ខ្លួនអ្នក អ្នកអាចធ្វើបានទាំងអស់ជាការពិតណាស់ ហើយចាប់ផ្តើម។

ដើម្បីចូលទៅកាន់សេវាកម្មសូមចុចលើរូប .

បញ្ជីនៃសេវាកម្មទទួលស្គាល់ captcha

  1. ទំនើបបំផុត និងពហុមុខងារ។


  • សមត្ថភាពក្នុងការដោះស្រាយនៅលើទូរស័ព្ទរបស់អ្នក។
  • តម្លៃសម្រាប់អតិថិជនគឺពី 14 រូប្លិ៍។ សម្រាប់ 1000 captchas ។
  • ការទូទាត់ - កាតប្រព័ន្ធទូទាត់។
  • សម្រាប់និយោជិត - ពី 10 ទៅ 30 រូប្លិ៍។ សម្រាប់ 1000 ដំណោះស្រាយ captchas អាស្រ័យលើចំនួនដែលអតិថិជនភ្នាល់។
  • ការដកប្រាក់ទៅ WebMoney ពី 30 រូប្លិ៍។

2. អាណាឡូកនៃទីមួយតែជាភាសាអង់គ្លេស និងជាដុល្លារប៉ុណ្ណោះ។

  • តម្លៃនៃការប្រឆាំង captcha គឺពី 0.5 ទៅ 1.2 ដុល្លារក្នុង 1000 captchas ។
  • តម្លៃសម្រាប់ការដោះស្រាយ captcha គឺប្រហែល 0.4 ដុល្លារ។
  • ដកប្រាក់ទៅ WebMoney ពី 0.5 ដុល្លារ។

3. សេវា bourgeois មួយផ្សេងទៀតសម្រាប់ការរកលុយនៅលើ captcha ។

  • នៅពេលចុះឈ្មោះ អ្នកនឹងត្រូវបញ្ចូលលេខកូដ "0808"។
  • បង់ចាប់ពី $0.8-1.5 ក្នុងមួយដំណោះស្រាយ។
  • ដកប្រាក់ពី $3 ទៅ WebMoney ។

4.

ផ្នែកបន្ថែមកម្មវិធីរុករកនេះនឹងដោះស្រាយ captcha ដោយស្វ័យប្រវត្តិនៅលើគេហទំព័រណាមួយ។

  • សម្រាប់ Chrome ។
  • Firefox ។
  • សាហ្វារី។

5.

  • តម្លៃសម្រាប់អតិថិជនគឺពី 14 រូប្លិ៍។ សម្រាប់ 1000 captchas ។
  • វិធីជាច្រើន។
  • សម្រាប់និយោជិត - ពី 1 ទៅ 10 kopecks ។
  • ដកប្រាក់ទៅ WebMoney ពី 10 រូប្លិ៍។

6.

  • ចាប់ពី $1 ក្នុង 1000 captchas ។
  • គ្មានប្រាក់ចំណូល។

7.

  • ពី 0.7 $ / 1000 ។
  • សម្រាប់និយោជិត - ពី 1 ទៅ 10 kopecks ។ ការងារត្រូវបានអនុវត្តនៅលើដែន - kolotibablo.com ។

8.

  • ពី $1.29 សម្រាប់ 1000 captchas ។
  • មិនមានកម្មករទេ។

9.

សេវាកម្មនេះផ្តល់នូវការទូទាត់សម្រាប់ការដោះស្រាយ captchas ដោយភាគីទីបី។

ឧទាហរណ៍ អ្នកដំឡើង captcha នៅលើគេហទំព័ររបស់អ្នក ឬតំណភ្ជាប់នៅលើអ៊ីនធឺណិត។

មើលវីដេអូប្រាប់ពីលទ្ធភាពទាំងអស់។

ថ្ងៃល្អ អស់លោក លោកស្រី។

សេវាកម្មទទួលស្គាល់ captcha ដោយស្វ័យប្រវត្តិអាចជួយក្នុងស្ថានភាពផ្សេងៗគ្នា។ ឧទាហរណ៍ពួកគេជួយសម្រួលយ៉ាងខ្លាំងដល់ការងាររបស់កម្មវិធីសម្រាប់ការប្រមូល ស្នូល semantic- Kay Collector, SlovoYob ជាដើម កម្មវិធីសម្រាប់ពិនិត្យមើលអត្ថបទសម្រាប់ភាពប្លែក និងការសរសេរឡើងវិញ - AntiPlagiarism ។

នៅ បរិមាណធំអត្ថបទ ឬសំណួរដូចគ្នា អ្នកអាចជួបនឹងប្រអប់បញ្ចូល captcha លេចឡើងរៀងរាល់ 10 វិនាទី។ មិនសូវស្រួលទេមែនទេ? Anti-captcha ដកហូតអ្នកពីតម្រូវការក្នុងការបញ្ចូលលេខ និងអក្សរដូចគ្នាទាំងនេះដោយដៃ។ នេះត្រូវបានធ្វើដោយអ្នកផ្សេងទៀតដែលរកលុយដោយការដោះស្រាយពួកគេ។ អ្នកគ្រាន់តែត្រូវបង់ប្រាក់សម្រាប់សេវាកម្មដែលផ្តល់ការបញ្ចូល captcha ដោយស្វ័យប្រវត្តិ។

កម្មវិធីភាគច្រើនដែលសហការជាមួយសេវាកម្មអនឡាញ (Wordstat, Google Analytics ។ល។) ទាមទារការបញ្ចូល captcha ថេរ។ វាមិនមានប្រយោជន៍សម្រាប់គម្រោងអនឡាញបែបនេះដែលមាន bots ធ្វើការជាមួយពួកគេទេ ដូច្នេះពួកគេកំពុងព្យាយាមអស់ពីកម្លាំងរបស់ពួកគេដើម្បីប្រយុទ្ធប្រឆាំងនឹងបញ្ហានេះ។

ប៉ុន្តែចុះយ៉ាងណាចំពោះអ្នកគ្រប់គ្រងគេហទំព័រសាមញ្ញដែលសម្រេចចិត្តប្រមូលទិន្នន័យ ឬញែកទិន្នន័យពីសេវាកម្មវិភាគ? ធ្វើវាដោយដៃ? មិនមែនជាការសម្រេចចិត្តសមហេតុសមផលទេ ជាពិសេស ដោយសារឥឡូវនេះមានកម្មវិធីជាច្រើនសម្រាប់ការឌិគ្រីប captcha ហើយពួកវាមិនគិតថ្លៃទេ។

Captcha ដោះស្រាយ មនុស្សពិតទទួលបានរង្វាន់សម្រាប់ការនេះ។ ពួកវាដំណើរការនៅក្នុងបង្អួចពិសេស ស្គ្រីបដែលប្តូរទិស captcha ពីកម្មវិធីរបស់អ្នកដោយផ្ទាល់ទៅពួកគេ។ ប្រសិនបើបញ្ចូលត្រឹមត្រូវ ការបំពេញដោយស្វ័យប្រវត្តិកើតឡើង។ កម្មវិធីរបស់អ្នកដំណើរការយ៉ាងរលូន ហើយអ្នកមិនចាំបាច់ព្រួយបារម្ភអំពីវាទៀតទេ។

គេហទំព័រទទួលស្គាល់ Captcha ផ្តល់ជូនបុគ្គលិករបស់ពួកគេនូវអត្រាផ្ទះល្វែងក្នុងមួយ captcha ។ អ្នក​ជា​អតិថិជន​ត្រូវ​ដាក់​ប្រាក់ ចំនួនជាក់លាក់មួយ។ដើម្បីឱ្យមានតុល្យភាព។ បន្តិចម្តងវានឹងថយចុះ។

សេវាកម្មបញ្ចូលដោយស្វ័យប្រវត្តិមិនតម្រូវឱ្យមានការវិនិយោគធំទេ។ 300 - 400 rubles សម្រាប់ជាច្រើនខែឬសូម្បីតែប្រាំមួយខែនឹងគ្រប់គ្រាន់ណាស់។ ប៉ុន្តែវាក៏អាស្រ័យលើបរិមាណនៃការប្រើប្រាស់ផងដែរ។

ដោយប្រើលេខកូដពិសេស ឬទិន្នន័យពីគណនីនៅលើគេហទំព័របែបនេះ អ្នកអាចរួមបញ្ចូល កម្មវិធីត្រឹមត្រូវ។ជាមួយនឹងសេវាកម្ម។

បញ្ជីនៃសេវាកម្មអនឡាញសម្រាប់ការទទួលស្គាល់ captcha

ប្រសិនបើអ្នកចង់ឱ្យឧបករណ៍ប្រើប្រាស់របស់អ្នកដំណើរការក្នុងរបៀប "ស្វ័យប្រវត្តិ" នោះអ្នកត្រូវស្គាល់ខ្លួនអ្នកជាមួយនឹងបញ្ជីនេះ។ នៅទីនេះខ្ញុំនឹងបង្ហាញសម្រាប់ការពិចារណារបស់អ្នកនូវគេហទំព័រពេញនិយមបំផុតដែលនឹងជួយអ្នកឱ្យកម្ចាត់តម្រូវការក្នុងការបញ្ចូល captcha ដោយដៃ។

RuCaptcha

RuCaptcha គឺជាគម្រោងដ៏ពេញនិយមដែលដោះស្រាយបញ្ហានៃការធ្វើការជាមួយកម្មវិធីជាច្រើន។ តម្លៃនៅទីនេះគឺខ្ពស់ជាងកន្លែងផ្សេងទៀត 10 រូប្លិ៍ប៉ុន្តែគុណភាពនិងល្បឿននៃការងារត្រូវគ្នានឹងបញ្ហានេះ។

វាអាចដំណើរការជាមួយការផ្ទៀងផ្ទាត់មនុស្សយន្តគ្រប់ប្រភេទ ដូច្នេះអ្នកមិនចាំបាច់បារម្ភទេ ប្រសិនបើ captcha ថ្មីពី Google ស្រាប់តែលេចចេញមក ដែលអ្នកត្រូវជ្រើសរើសផ្លាកសញ្ញាផ្លូវមួយចំនួន។ល។ អ្នកប្រើប្រាស់ RuCapcha អាចដោះស្រាយវាបានយ៉ាងងាយស្រួលក្នុងពីរបី។ នាទី

បើមិនដូច្នេះទេ សេវាកម្មគឺស្រដៀងនឹងសេវាកម្មផ្សេងទៀត។ API ងាយស្រួល ការរួមបញ្ចូលជាមួយកម្មវិធីស្ទើរតែទាំងអស់ ហើយសំខាន់បំផុត - ចំនួនធំអ្នកសំដែង។ មនុស្សជាច្រើនស្គាល់នៅក្នុង ពេលទំនេរដោយហេតុនេះជួយអ្នកប្រើប្រាស់ធម្មតា។

2 Captcha

ធនធានភាសាអង់គ្លេសស្រដៀងនឹង RuCapcha ។ តម្លៃមធ្យមសម្រាប់ 1,000 ទាយ - ពាក់កណ្តាលប្រាក់ដុល្លារ។ ដោយផ្អែកលើចំណុចនេះ យើងអាចសន្និដ្ឋានបានថាតម្លៃគឺដូចគ្នាទៅនឹងទីផ្សារ CIS ដែរ។

2Captcha ដំណើរការល្អជាមួយ Google ។ តាមក្បួនមានកម្មករនិយាយភាសាអង់គ្លេសដែលមានជំនាញសុទ្ធសាធនៅក្នុង Google captchas ។ ជាមួយនឹងជម្រើសរុស្ស៊ី (ពី Yandex ដូចគ្នា) បញ្ហាអាចកើតឡើង។ ប៉ុន្តែខ្ញុំគិតថានឹងមានអ្នកសំដែងនៅទីនោះផងដែរ។

ប្រឆាំង Captcha

Anti Captcha គឺជាសេវាកម្មទំនើប (អតីត Antigate) ដែលផ្តល់សេវាកម្មសម្រាប់ការដោះស្រាយនិមិត្តសញ្ញាដោយស្វ័យប្រវត្តិ។ គម្រោងនេះត្រូវបានសម្គាល់ដោយ API សាមញ្ញបំផុត អ្នកសំដែងមួយចំនួនធំ និងតម្លៃទាប។

បើប្រៀបធៀបតម្លៃថោក និងសេវាកម្មដែលមានគុណភាពខ្ពស់ប្រាកដជាមិនទុកឱ្យអ្នកព្រងើយកន្តើយឡើយ។ គេហទំព័រនេះមានភាពល្បីល្បាញនៅលើ Runet ដូច្នេះហើយពេលវេលាជាមធ្យមដើម្បីដោះស្រាយនិមិត្តសញ្ញាគឺត្រឹមតែ 10 - 15 វិនាទីប៉ុណ្ណោះ។ នោះគឺអ្នកស្ទើរតែមិនចាំបាច់រង់ចាំរហូតដល់ captcha របស់អ្នកត្រូវបានដោះស្រាយ។

គម្រោងនេះគឺសមរម្យសម្រាប់ការទទួលស្គាល់ដោយផ្ទាល់នៅក្នុងកម្មវិធីរុករក។ ជម្រើសមានប្រយោជន៍ទៅវិញទៅមកដែលអាចជួយអ្នកចាប់ផ្តើមដំបូងរកប្រាក់បាន ហើយក្នុងពេលតែមួយធ្វើឱ្យការងាររបស់អ្នកជំនាញកាន់តែងាយស្រួល។

តើសេវាកម្មមួយណាដែលត្រូវជ្រើសរើសគឺអាស្រ័យលើអ្នកក្នុងការសម្រេចចិត្ត។ នីមួយៗមានគុណសម្បត្តិ និងគុណវិបត្តិរៀងៗខ្លួន។ រឿងមួយអាចនិយាយបាន៖ គម្រោងនីមួយៗបានដំណើរការគ្រប់គ្រាន់ហើយ។ យូរ. អ្នកមិនចាំបាច់បារម្ភថាអ្នកនឹងត្រូវបោកបញ្ឆោត លុយរបស់អ្នកនឹងត្រូវបានលួច ឬមេរោគណាមួយនឹងត្រូវបានផ្ញើទៅកាន់កុំព្យូទ័ររបស់អ្នក។ នេះពិតជានឹងមិនកើតឡើងទេ ប៉ុន្តែនេះមិនអាចនិយាយអំពីអ្នកដទៃបានទេ។

សូមប្រយ័ត្នពេលជ្រើសរើសសេវាកម្មប្រឆាំង captcha ។ RuNet គឺពោរពេញទៅដោយក្លែងក្លាយដែលប្រព្រឹត្តការក្លែងបន្លំ។ ប្រសិនបើអ្នកភ្លាមៗសម្រេចចិត្តសាកល្បងគម្រោងដែលមិនស្គាល់តម្លៃថោកជាង នោះវាជាការប្រសើរសម្រាប់អ្នកដើម្បីពិនិត្យមើលការវាយតម្លៃអំពីវាមុនពេលប្រើវា។ វាអាចទៅរួចដែលថានេះគឺជាធនធានបន្លំដែលប្រមូលប្រាក់ពីអ្នកប្រើប្រាស់ដែលអាចយល់បាន។

ការណែនាំសម្រាប់ធ្វើការជាមួយសេវាកម្ម

នៅពេលដែលអ្នកជ្រើសរើសសេវាកម្មប្រឆាំង captcha តាមអ៊ីនធឺណិត អ្នកនឹងត្រូវប្រើវាតាមរបៀបណាមួយ។ ជាធម្មតាសេវាកម្មបែបនេះមាន គ្រាប់ចុចពិសេស- អ្នកទទួលបានពួកវានៅក្នុងគណនីរបស់អ្នក បន្ទាប់ពីនោះអ្នកបញ្ចូលពួកវាទៅក្នុងវាលពិសេសនៅក្នុងកម្មវិធី។ ជាផ្នែកមួយនៃសម្ភារៈថ្ងៃនេះ ខ្ញុំនឹងពិនិត្យមើល RuCapcha ។

តោះទៅផ្នែក "API for webmaster" ដែលយើងឃើញអ្វីមួយដូចនេះ។

មានវាល "captcha KEY" នៅទីនេះ - នោះហើយជាអ្វីដែលយើងត្រូវការ។ យើងចម្លងកូនសោនេះ ហើយចូលទៅកាន់ការកំណត់ប្រឆាំង captcha នៃកម្មវិធីរបស់យើង។

ធីកប្រអប់ "ប្រើសេវាកម្មប្រឆាំង captcha" ជ្រើសរើសសេវាកម្មពីបញ្ជីទម្លាក់ចុះហើយបញ្ចូលសោ។ រួចរាល់ហើយ! ឥឡូវនេះកម្មវិធីរបស់យើងនឹង "ដោះស្រាយ" captcha ដោយស្វ័យប្រវត្តិដោយប្រើសេវាកម្មសមស្រប។ មិនតម្រូវឱ្យមានសកម្មភាពបន្ថែមពីអ្នកទេ។ គ្រាន់តែបំពេញគណនីរបស់អ្នកនៅលើគេហទំព័រក្នុងលក្ខណៈទាន់ពេលវេលា។

ការកំណត់នៅក្នុងកម្មវិធីទាំងអស់នេះគឺស្ទើរតែដូចគ្នា។ ហើយនៅក្នុង Key Collector និងនៅក្នុង SlovoYob និងនៅក្នុងកម្មវិធីផ្សេងទៀត អ្វីគ្រប់យ៉ាងនឹងមើលទៅប្រហាក់ប្រហែលដូចដែលខ្ញុំបានពណ៌នា។

សេចក្តីសន្និដ្ឋាន

ឥឡូវនេះអ្នកដឹងពីរបៀបដើម្បីរំលងការបញ្ចូលតួអក្សរនិង ការត្រួតពិនិត្យផ្សេងៗ"តើអ្នកមិនមែនជាមនុស្សយន្តទេ?" ប្រើប្រាស់សេវាកម្មអនឡាញ។ ការអនុវត្តងាយស្រួលនិង ការអនុវត្តសាមញ្ញ. អ្នកអាចដក captcha ចេញពីជីវិតរបស់អ្នកជារៀងរហូតដោយគ្រាន់តែបំពេញសមតុល្យរបស់អ្នកម្តងម្កាល។ តាមក្បួនមួយលុយតិចតួចណាស់ត្រូវបានចំណាយលើគម្រោងបែបនេះប៉ុន្តែមានអត្ថប្រយោជន៍ច្រើន។

នៅក្នុង Key Collector ដូចគ្នា captcha នេះអាចគាំងជាញឹកញាប់ ដោយរារាំងអ្នកពីការងាររបស់អ្នក។ ដូច្នេះហើយ យើងបានភ្ជាប់កម្មវិធីទៅនឹងសេវាកម្ម បានចាប់ផ្តើមប្រមូលស្នូល semantic ហើយយើងអាចនិយាយអំពីអាជីវកម្មរបស់យើង។ ដូចគ្នានេះដែរអនុវត្តចំពោះឧបករណ៍ប្រើប្រាស់ផ្សេងទៀតដែលតម្រូវឱ្យមានការបញ្ចូលតួអក្សរថេរ។

ប្រហែលជាអ្នកប្រើប្រាស់អ៊ិនធឺណិតជាច្រើនយ៉ាងហោចណាស់នៅថ្ងៃណាមួយត្រូវបញ្ចូល captcha នេះ។ វិធីធម្មតា។និយមន័យ កម្មវិធីស្វ័យប្រវត្តិតើអ្នកជាមនុស្សយន្ត ឬមនុស្ស? ដូច្នេះវាកើតឡើងដែលអ្នកត្រូវកំណត់បណ្តុំនៃរូបភាពទាំងមូល ហើយអ្នកមិនចង់ខ្ជះខ្ជាយពេលវេលាក្នុងការបញ្ចូលរូបភាពនីមួយៗនោះទេ។

    • លក្ខណៈវិនិច្ឆ័យសម្រាប់ការជ្រើសរើសកម្មវិធីសម្រាប់ការទទួលស្គាល់ captcha
    • រមូរ កម្មវិធីឥតគិតថ្លៃដើម្បីរំលង captchas និងភាពខុសគ្នារបស់ពួកគេ។

ប្រសិនបើអ្នកប្រឈមមុខនឹងបញ្ហាបែបនេះ មានដំណោះស្រាយមួយ - សេវាកម្មអនឡាញដែលនឹងជួយអ្នកមិនចំណាយ ម៉ោងបន្ថែមដើម្បីបញ្ចូល captchas ។ វាមិនមែនជារឿងសម្ងាត់ទេ នៅពេលដែលកម្មវិធីទទួលស្គាល់អ្នកប្រើប្រាស់ត្រូវបានធ្វើឱ្យប្រសើរឡើង (កំណត់ថាតើវាជាមនុស្ស ឬមនុស្សយន្ត) កម្មវិធីដែលអាចបំបែកសុវត្ថិភាព និងទទួលស្គាល់ captcha ដោយស្វ័យប្រវត្តិក៏ត្រូវបានធ្វើឱ្យប្រសើរឡើងផងដែរ។ មាន កម្មវិធីថ្លៃ ៗដូច​ជា OCR ដែល​ធ្វើ​បាន​យ៉ាង​ល្អ​នៃ​កិច្ចការ។ ប៉ុន្តែ​អ្នក​ឃើញ​ទេ​ដែល​ចង់​ចំណាយ​ប្រាក់​ច្រើន​ដើម្បី​ស្គាល់​រូបភាព។ ដោយសារតែ ស្ថានភាពអស់សង្ឃឹមមិនកើតឡើងទេ ដំណោះស្រាយក៏ត្រូវបានរកឃើញក្នុងករណីនេះដែរ - សេវាអនឡាញឥតគិតថ្លៃហើយវាគួរអោយកត់សំគាល់ថាគាត់មិនមែនជាមនុស្សតែម្នាក់នោះទេ។ ខាងក្រោមនេះយើងនឹងពិនិត្យមើលឱ្យកាន់តែដិតដល់នូវជម្រើសដែលមាន។

លក្ខណៈវិនិច្ឆ័យសម្រាប់ការជ្រើសរើសកម្មវិធីសម្រាប់ការទទួលស្គាល់ captcha

ប្រសិនបើអ្នកបានចូលរួមក្នុងសកម្មភាពណាមួយដែលទាមទារឱ្យមានការទទួលស្គាល់ជាប្រចាំនៃកូដ នោះវាសមហេតុផលក្នុងការទិញកំណែកម្មវិធីដែលមានតំលៃថ្លៃ នៅក្នុងករណីពេលដែលអ្នកត្រូវអនុវត្តដំណើរការនៅក្នុងសំណួរមិនញឹកញាប់នោះ អ្នកមិនគួរបោះចោលទេ។ ផលបូកធំ សាច់ប្រាក់សម្រាប់រឿងបែបនេះ សេវាឥតគិតថ្លៃដែលមិនពិបាកប្រើ។

មានសេវាកម្មបែបនេះរាប់សិប ហើយអ្នកប្រើប្រាស់មានឱកាសប្រើប្រាស់ពួកវាណាមួយ ដូច្នេះវានឹងមានច្រើនដើម្បីជ្រើសរើស។

ដើម្បីធ្វើ ជម្រើសត្រឹមត្រូវ។ក្នុងចំណោមកម្មវិធីផ្សេងៗ ទិដ្ឋភាពខាងក្រោមត្រូវតែយកមកពិចារណា៖

  • ជាដំបូង សេវាកម្មដែលអ្នកជ្រើសរើសត្រូវតែឥតគិតថ្លៃទាំងស្រុង។ លក្ខណៈវិនិច្ឆ័យនេះគឺសំខាន់បំផុត ដូច្នេះត្រូវប្រាកដថាមិនមានការរឹតបន្តឹងក្នុងរឿងនេះទេ។
  • សេវាកម្មដែលបានជ្រើសរើសត្រូវតែអាច "ទាយ" អត្ថបទជាភាសារុស្សីដោយគ្មានលក្ខណៈវិនិច្ឆ័យនេះ អ្នកទំនងជាមិនអាចធ្វើឱ្យដំណើរការនៃការបញ្ចូល captchas ដោយស្វ័យប្រវត្តិបានទេ។
  • ចំនួន captchas ដែលអាចកំណត់ដោយស្វ័យប្រវត្តិគួរតែគ្មានដែនកំណត់។

មើលវីដេអូ - របៀបបើក ការទទួលស្គាល់ captchaនិងតាមរយៈ antigate, rucaptcha, captcha24, captchabot នៅលើ DelphiXE5

បញ្ជីកម្មវិធីឥតគិតថ្លៃសម្រាប់ការរំលង captchas និងភាពខុសគ្នារបស់ពួកគេ។

ដូច្នេះ ចូរ​យើង​ចាប់​ផ្ដើម​មើល​ការ​មាន ជម្រើសឥតគិតថ្លៃ, បន្ទាប់នៅក្នុងជួរ សេវាកម្មអនឡាញ ថាស Google. ដើម្បីប្រើកម្មវិធីនៅក្នុងសំណួរ អ្នកនឹងត្រូវចុះឈ្មោះ វគ្គនៃព្រឹត្តិការណ៍នេះកំពុងរង់ចាំអ្នកប្រើប្រាស់នៅក្នុងសេវាកម្មស្ទើរតែទាំងអស់ដែលមានគោលបំណងស្រដៀងគ្នា។ ក្នុងករណីនោះ។ ប្រសិនបើអ្នកធ្លាប់បង្កើតពីមុនមក។ ឧទាហរណ៍ ប្លុកនៅលើ blogspot បន្ទាប់មកអ្នកត្រូវចុះឈ្មោះចូល ក្នុងករណីនេះនឹងមិនត្រូវការទេ។ វាអាចទៅរួចនៅទីនេះ ការបញ្ចូលដោយស្វ័យប្រវត្តិ captcha បែបនេះ៖ PDF, JPG, PNG និង GIF ។ វាគួរតែត្រូវបានកត់សម្គាល់ថាទំហំនៃឯកសារសម្រាប់ការទទួលស្គាល់គួរតែមិនលើសពី 2-3 មេកាបៃ។

សេវាកម្មអនឡាញ OCR បំលែង។ នៅទីនេះអ្នកប្រើប្រាស់នឹងមិនចាំបាច់ចុះឈ្មោះទេ។ ទ្រង់ទ្រាយ Captcha ដែលត្រូវបានគាំទ្រមានដូចខាងក្រោម៖ JPEG, GIF, BMP ។ វាគួរតែត្រូវបានកត់សម្គាល់ថាឯកសារដែលបានរក្សាទុកគឺនៅក្នុងទម្រង់នៃតំណភ្ជាប់ URL ដែលជាផ្នែកបន្ថែមនៃទម្រង់ TXT ។ នៅទីនេះអ្នកប្រើប្រាស់អាចផ្ទុកឯកសារ 5-7 ក្នុងពេលដំណាលគ្នា។

សេវាកម្ម i2OCR ។ ដើម្បីស្គាល់ captchas អ្នកត្រូវតែចុះឈ្មោះជាមុនសិន។ មិន​អាច​មាន​ឯកសារ​និង​ឯកសារ​ច្រើន​ជាង 10 ដែល​បាន​ផ្ទុក​ឡើង​ក្នុង​ពេល​តែ​មួយ​ដោយ​ការ​ប្រើ​សេវា​នេះ​គឺ​ងាយ​ស្រួល​និង​សាមញ្ញ។ ទម្រង់ដែលវាទទួលស្គាល់គឺ៖ GIF, PBM, PGM, PPM ។

បរិភោគ វិធីផ្សេងគ្នាសម្រាប់ ឆ្លងកាត់ CAPTCHAជាមួយនឹងគេហទំព័រណាដែលត្រូវបានការពារ។ ទីមួយមាន សេវាកម្មពិសេសដែលប្រើកម្លាំងពលកម្មដោយដៃថោក ហើយផ្តល់ជូនដើម្បីដោះស្រាយ 1000 captchas ក្នុងតម្លៃ 1 ដុល្លារ។ ជាជម្រើសមួយ អ្នកអាចសាកល្បងសរសេរ ប្រព័ន្ធឆ្លាតវៃដែលយោងទៅតាមក្បួនដោះស្រាយជាក់លាក់នឹងអនុវត្តការទទួលស្គាល់ខ្លួនឯង។ ក្រោយមកទៀតអាចត្រូវបានអនុវត្តដោយប្រើឧបករណ៍ប្រើប្រាស់ពិសេស។

ដោះស្រាយ CAPTCHA

ការទទួលស្គាល់ CAPTCHA ច្រើនតែជាកិច្ចការដែលមិនមែនជារឿងតូចតាច។ វាចាំបាច់ក្នុងការអនុវត្តតម្រងផ្សេងៗគ្នាជាច្រើនទៅលើរូបភាព ដើម្បីលុបការបង្ខូចទ្រង់ទ្រាយ និងការជ្រៀតជ្រែក ដែលអ្នកអភិវឌ្ឍន៍ចង់ប្រើដើម្បីពង្រឹងការការពារ។ ជារឿយៗវាចាំបាច់ដើម្បីអនុវត្តប្រព័ន្ធសិក្សាដោយផ្អែកលើ បណ្តាញសរសៃប្រសាទ(ដោយវិធីនេះមិនពិបាកដូចដែលវាហាក់ដូចជា) ដើម្បីសម្រេចបាននូវលទ្ធផលដែលអាចទទួលយកបាននៅក្នុងដំណោះស្រាយស្វ័យប្រវត្តិនៃ captchas ។ ដើម្បីយល់ពីអ្វីដែលខ្ញុំកំពុងនិយាយ វាជាការប្រសើរក្នុងការបើកបណ្ណសារ ហើយអានអត្ថបទដ៏អស្ចារ្យ “ការបំបែក CAPTCHA៖ ទ្រឹស្តី និងការអនុវត្ត។ ចូរស្វែងយល់ពីរបៀបដែល captchas ត្រូវបានខូច” និង “តោះមើល និងទទួលស្គាល់។ ការលួចយកតម្រង Captcha" ពីលេខ #135 និង #126 រៀងគ្នា។ ថ្ងៃនេះខ្ញុំចង់ប្រាប់អ្នកអំពីការអភិវឌ្ឍន៍ TesserCap ដែលអ្នកនិពន្ធហៅថាជាឧបករណ៍ដោះស្រាយ CAPTCHA ជាសកល។ ជា​រឿង​គួរ​ឱ្យ​ចង់​ដឹង​អ្វី​ដែល​អ្នក​អាច​និយាយ​។

ដំបូងមើល TesserCap

តើ​អ្នក​និពន្ធ​កម្មវិធី​បាន​ធ្វើ​អ្វី? គាត់បានក្រឡេកមើលពីរបៀបដែលបញ្ហានៃការដោះស្រាយ CAPTCHA ដោយស្វ័យប្រវត្តិត្រូវបានទាក់ទងជាធម្មតា ហើយព្យាយាមសង្ខេបបទពិសោធន៍នេះនៅក្នុងឧបករណ៍មួយ។ អ្នកនិពន្ធបានកត់សម្គាល់ថា ដើម្បីលុបសំលេងរំខានចេញពីរូបភាព នោះគឺដើម្បីដោះស្រាយបញ្ហាលំបាកបំផុតក្នុងការទទួលស្គាល់ captchas តម្រងដូចគ្នាត្រូវបានគេប្រើញឹកញាប់បំផុត។ វាប្រែថាប្រសិនបើអ្នកអនុវត្ត ឧបករណ៍ងាយស្រួលដែលអនុញ្ញាតឱ្យអ្នកអនុវត្តតម្រងទៅលើរូបភាពដោយមិនមានការបំប្លែងគណិតវិទ្យាស្មុគស្មាញ ហើយបញ្ចូលវាជាមួយប្រព័ន្ធ OCR សម្រាប់ការសម្គាល់អត្ថបទ អ្នកអាចទទួលបានកម្មវិធីដែលមានមុខងារទាំងស្រុង។ នេះជាការពិត អ្វីដែល Gursev Singh Kalra មកពី McAfee បានធ្វើ។ ហេតុអ្វីបានជាវាចាំបាច់? អ្នកនិពន្ធឧបករណ៍ប្រើប្រាស់បានសម្រេចចិត្តពិនិត្យមើលតាមរបៀបនេះថាតើការចាប់យកធនធានធំ ៗ មានសុវត្ថិភាពប៉ុណ្ណា។ សម្រាប់ការសាកល្បង យើងបានជ្រើសរើសគេហទំព័រអ៊ីនធឺណែតដែលមានអ្នកចូលមើលច្រើនជាងគេ យោងទៅតាមសេវាកម្មស្ថិតិល្បី។ បេក្ខជនសម្រាប់ការចូលរួមក្នុងការធ្វើតេស្តរួមមានសត្វចម្លែកដូចជា Wikipedia, eBay, និងអ្នកផ្តល់ captcha reCaptcha ។

ប្រសិនបើពិចារណានៅក្នុង គ្រោងទូទៅគោលការណ៍ប្រតិបត្តិការនៃកម្មវិធីគឺសាមញ្ញណាស់។ captcha ដើមចូលទៅក្នុងប្រព័ន្ធដំណើរការមុនរូបភាព ដែលសម្អាត captcha ពីសំលេងរំខាន និងការបង្ខូចទ្រង់ទ្រាយ ហើយផ្ទេររូបភាពលទ្ធផលតាមរយៈ conveyor ទៅកាន់ប្រព័ន្ធ OCR ដែលព្យាយាមសម្គាល់អត្ថបទនៅលើវា។ TesserCap មានចំណុចប្រទាក់ក្រាហ្វិកអន្តរកម្ម និងមានលក្ខណៈសម្បត្តិដូចខាងក្រោមៈ

  1. វាមានប្រព័ន្ធដំណើរការមុនរូបភាពជាសកលដែលអាចកំណត់រចនាសម្ព័ន្ធសម្រាប់ captcha នីមួយៗ។
  2. រួមបញ្ចូលម៉ាស៊ីនទទួលស្គាល់ Tesseract ដែលទាញយកអត្ថបទពីរូបភាព CAPTCHA ដែលបានញែកជាមុន និងរៀបចំ។
  3. គាំទ្រការប្រើប្រាស់ការអ៊ិនកូដផ្សេងៗនៅក្នុងប្រព័ន្ធទទួលស្គាល់។

គិត, អត្ថន័យទូទៅវាច្បាស់ណាស់ ដូច្នេះខ្ញុំស្នើឱ្យអ្នកមើលថាតើវាមើលទៅដូចម្ដេច។ ភាពប៉ិនប្រសប់នៃឧបករណ៍ប្រើប្រាស់មិនអាចប៉ុន្តែនាំទៅរកភាពស្មុគស្មាញនៃចំណុចប្រទាក់របស់វា ដូច្នេះបង្អួចកម្មវិធីអាចនាំឱ្យមានភាពស្ទាក់ស្ទើរបន្តិច។ ដូច្នេះ មុននឹងផ្លាស់ទីដោយផ្ទាល់ទៅការទទួលស្គាល់ captchas ខ្ញុំស្នើឱ្យអ្នកយល់ពីចំណុចប្រទាក់របស់វា និងមុខងារដែលភ្ជាប់មកជាមួយ។


រូបភាពមុនដំណើរការ និងស្រង់ចេញ
អត្ថបទពី captcha

អំពី

យើងមិនអាចជួយបានទេប៉ុន្តែនិយាយយ៉ាងហោចណាស់ពាក្យពីរបីអំពីអ្នកនិពន្ធនៃឧបករណ៍ប្រើប្រាស់ TesserCap ដ៏អស្ចារ្យ។ ឈ្មោះរបស់គាត់គឺ Gursev Singh Kalra ។ គាត់គឺជាអ្នកប្រឹក្សាដ៏សំខាន់សម្រាប់ផ្នែកសេវាកម្មវិជ្ជាជីវៈរបស់ Foundstone ដែលជាផ្នែកមួយនៃ McAfee ។ Gursev បាននិយាយនៅក្នុងសន្និសីទដូចជា ToorCon, NullCon និង ClubHack ។ គាត់គឺជាអ្នកនិពន្ធឧបករណ៍ TesserCap និង SSLSmart ។ លើសពីនេះទៀតគាត់បានបង្កើតឧបករណ៍ជាច្រើនសម្រាប់តម្រូវការផ្ទៃក្នុងរបស់ក្រុមហ៊ុន។ ភាសាសរសេរកម្មវិធីដែលចូលចិត្តគឺ Ruby, Ruby on Rails និង C# ។ ផ្នែកសេវាកម្មវិជ្ជាជីវៈរបស់Foundstone® ជាកន្លែងដែលគាត់ធ្វើការ ផ្តល់ឱ្យអង្គការនូវសេវាកម្មអ្នកជំនាញ និងការបណ្តុះបណ្តាល ផ្តល់ការបន្ត និង ការការពារប្រកបដោយប្រសិទ្ធភាពទ្រព្យសម្បត្តិរបស់ពួកគេពីការគំរាមកំហែងធ្ងន់ធ្ងរបំផុត។ ក្រុមសេវាកម្មវិជ្ជាជីវៈមានអ្នកជំនាញសុវត្ថិភាព និងអ្នកអភិវឌ្ឍន៍ដែលត្រូវបានទទួលស្គាល់ដែលមានបទពិសោធន៍យ៉ាងទូលំទូលាយក្នុងការធ្វើការជាមួយសាជីវកម្មអន្តរជាតិ និងទីភ្នាក់ងាររដ្ឋាភិបាល។

ចំណុចប្រទាក់។ ផ្ទាំងមេ

បន្ទាប់​ពី​បើក​ដំណើរការ​កម្មវិធី យើង​ត្រូវ​បាន​បង្ហាញ​ជាមួយ​បង្អួច​មួយ​ដែល​មាន​ផ្ទាំង​ចំនួន​បី៖ មេ, ជម្រើស, ការ​ដំណើរការ​រូបភាព។ ផ្ទាំងមេមានការគ្រប់គ្រងដែលត្រូវបានប្រើដើម្បីចាប់ផ្តើម និងបញ្ឈប់ការធ្វើតេស្តរូបភាព CAPTCHA បង្កើតស្ថិតិសាកល្បង (ចំនួនប៉ុន្មានត្រូវបានទាយ និងចំនួនប៉ុន្មានមិន) រុករក និងជ្រើសរើសរូបភាពសម្រាប់ដំណើរការមុន។ វាលបញ្ចូល URL (វត្ថុបញ្ជា #1) ត្រូវតែមាន URL ពិតប្រាកដដែលកម្មវិធីគេហទំព័រប្រើដើម្បីទាញយក captchas ។ URL អាចទទួលបានដោយចុចលើជ្រុងខាងស្តាំនៃរូបភាព CAPTCHA ចម្លង ឬមើលកូដទំព័រ ហើយស្រង់ URL ចេញពីគុណលក្ខណៈ src នៃស្លាករូបភាព ..site/common/rateit/captcha.asp?. នៅជាប់នឹងបន្ទាត់អាស័យដ្ឋាន មានធាតុដែលបញ្ជាក់ចំនួន captchas ដែលត្រូវការទាញយកសម្រាប់សាកល្បង។ ដោយសារកម្មវិធីអាចបង្ហាញរូបភាពបានតែ 12 ប៉ុណ្ណោះក្នុងពេលតែមួយ វាផ្តល់នូវការគ្រប់គ្រងសម្រាប់ការរុករកមួយទំព័រនៃ captchas ដែលបានទាញយក។ ដូច្នេះ ក្នុងអំឡុងពេលធ្វើតេស្តទ្រង់ទ្រាយធំ យើងនឹងអាចរមូរតាមរយៈ captchas ដែលបានទាញយក និងមើលលទ្ធផលនៃការទទួលស្គាល់របស់ពួកគេ។ ប៊ូតុងចាប់ផ្តើម និងបញ្ឈប់ចាប់ផ្តើម និងបញ្ឈប់ការធ្វើតេស្តរៀងៗខ្លួន។ បន្ទាប់ពីការធ្វើតេស្ត អ្នកត្រូវវាយតម្លៃលទ្ធផលនៃការទទួលស្គាល់រូបភាព ដោយសម្គាល់ពួកវានីមួយៗថាត្រឹមត្រូវ ឬមិនត្រឹមត្រូវ។ ជាការប្រសើរណាស់ មុខងារដ៏សំខាន់បំផុតចុងក្រោយគឺបម្រើដើម្បីផ្ទេររូបភាពណាមួយទៅប្រព័ន្ធដំណើរការមុន ដែលនៅក្នុងនោះ តម្រងត្រូវបានកំណត់ដែលដកសំឡេងរំខាន និងការបង្ខូចទ្រង់ទ្រាយចេញពីរូបភាព។ ដើម្បីផ្ទេររូបភាពទៅប្រព័ន្ធដំណើរការមុន អ្នកត្រូវចុចកណ្ដុរស្ដាំលើរូបភាពដែលចង់បាន និង ម៉ឺនុយបរិបទជ្រើសរើស Send To Image Preprocessor។

ចំណុចប្រទាក់។ ផ្ទាំងជម្រើស

ផ្ទាំងជម្រើសមាន ធាតុផ្សេងៗគ្រប់គ្រងដើម្បីកំណត់រចនាសម្ព័ន្ធ TesserCap ។ នៅទីនេះអ្នកអាចជ្រើសរើសប្រព័ន្ធ OCR កំណត់ប៉ារ៉ាម៉ែត្រប្រូកស៊ីគេហទំព័រ បើកការបញ្ជូនបន្តរូបភាព និងដំណើរការមុន បន្ថែមបឋមកថា HTTP ផ្ទាល់ខ្លួន និងបញ្ជាក់ជួរតួអក្សរសម្រាប់ប្រព័ន្ធទទួលស្គាល់ផងដែរ៖ លេខ អក្សរតូច អក្សរក្នុង អក្សរធំ, តួអក្សរពិសេស។

ឥឡូវនេះអំពីជម្រើសនីមួយៗដោយលម្អិតបន្ថែមទៀត។ ដំបូងអ្នកអាចជ្រើសរើសប្រព័ន្ធ OCR ។ តាមលំនាំដើម មានតែមួយប៉ុណ្ណោះដែលអាចប្រើបាន - Tesseract-ORC ដូច្នេះអ្នកមិនចាំបាច់រំខានជាមួយជម្រើសនៅទីនេះទេ។ មួយទៀតខ្លាំងណាស់ ឱកាសគួរឱ្យចាប់អារម្មណ៍កម្មវិធី - ជ្រើសរើសជួរនៃតួអក្សរ។ ជាឧទាហរណ៍ សូមយក captcha ពីគេហទំព័រ - វាច្បាស់ណាស់ថាវាមិនមានអក្សរតែមួយទេ ប៉ុន្តែមានតែលេខប៉ុណ្ណោះ។ ដូច្នេះហេតុអ្វីបានជាយើងត្រូវការនិមិត្តសញ្ញាបន្ថែមដែលនឹងគ្រាន់តែបង្កើនប្រូបាប៊ីលីតេប៉ុណ្ណោះ។ ការទទួលស្គាល់មិនត្រឹមត្រូវ? ប៉ុន្តែចុះយ៉ាងណាបើអ្នកជ្រើសរើស Upper Case? តើកម្មវិធីនេះអាចស្គាល់ captcha ដែលមាន អក្សរធំភាសាណាមួយ? ទេ គាត់មិនអាចទេ។ កម្មវិធីនេះយកបញ្ជីតួអក្សរដែលប្រើសម្រាប់ការទទួលស្គាល់ពី ឯកសារកំណត់រចនាសម្ព័ន្ធដែលមានទីតាំងនៅក្នុង \Program Files\Foundstone Free Tools\TesserCap 1.0\tessdata\configs ។ ខ្ញុំសូមពន្យល់ជាមួយឧទាហរណ៍មួយ៖ ប្រសិនបើយើងជ្រើសរើសជម្រើសលេខ និងអក្សរតូច កម្មវិធីនឹងចូលប្រើឯកសារលេខទាប ដោយចាប់ផ្តើមជាមួយប៉ារ៉ាម៉ែត្រ tessedit ចារបញ្ជីស។ វាត្រូវបានបន្តដោយបញ្ជីតួអក្សរដែលនឹងត្រូវបានប្រើដើម្បីដោះស្រាយ captcha ។ តាមលំនាំដើម ឯកសារមានតែអក្សរប៉ុណ្ណោះ។ អក្ខរក្រមឡាតាំងដូច្នេះ ដើម្បីស្គាល់អក្ខរក្រម Cyrillic អ្នកត្រូវជំនួស ឬបន្ថែមបញ្ជីតួអក្សរ។

ឥឡូវនេះបន្តិចអំពីអ្វីដែលវាល Http Request Headers ត្រូវការសម្រាប់។ ឧទាហរណ៍ នៅលើគេហទំព័រមួយចំនួន អ្នកត្រូវចូលដើម្បីមើល captcha ។ ដើម្បីឱ្យ TesserCap ចូលប្រើ captcha កម្មវិធីត្រូវតែផ្ញើទៅ សំណើ HTTPបឋមកថាដូចជា Accept, Cookie និង Referrer ជាដើម។ ដោយប្រើប្រូកស៊ីបណ្តាញ (Fiddler, Burp, Charles, WebScarab, Paros ។ ជម្រើសមួយទៀតដែលប្រាកដជានឹងមានប្រយោជន៍គឺ Follow Redirects ។ រឿងនេះគឺថា TesserCap មិនធ្វើតាមការបញ្ជូនបន្តតាមលំនាំដើមទេ។ ប្រសិនបើ URL សាកល្បងត្រូវការធ្វើតាមការបញ្ជូនបន្តដើម្បីទទួលបានរូបភាព អ្នកត្រូវជ្រើសរើសជម្រើសនេះ។

ជាការប្រសើរណាស់, មានជម្រើសចុងក្រោយមួយដែលនៅសល់, បើក / បិទយន្តការដំណើរការមុនរូបភាព, ដែលយើងនឹងពិចារណាបន្ថែមទៀត។ តាមលំនាំដើម ការដំណើរការរូបភាពជាមុនត្រូវបានបិទ។ អ្នកប្រើប្រាស់ដំបូងកំណត់រចនាសម្ព័ន្ធតម្រងរូបភាពមុនដំណើរការដោយយោងតាមរូបភាព CAPTCHA ដែលកំពុងត្រូវបានសាកល្បង ហើយបន្ទាប់មកធ្វើឱ្យម៉ូឌុលនេះសកម្ម។ រូបភាព CAPTCHA ទាំងអស់ដែលបានផ្ទុកបន្ទាប់ពីបើកជម្រើសបើកដំណើរការរូបភាពជាមុនត្រូវបានដំណើរការជាមុន ហើយបន្ទាប់មកផ្ញើទៅប្រព័ន្ធ Tesseract OCR សម្រាប់ការទាញយកអត្ថបទ។

ចំណុចប្រទាក់។ ផ្ទាំងដំណើរការរូបភាពជាមុន

ជាការប្រសើរណាស់, យើងបានឈានដល់ផ្ទាំងគួរឱ្យចាប់អារម្មណ៍បំផុត។ នេះគឺជាកន្លែងដែលតម្រងត្រូវបានកំណត់រចនាសម្ព័ន្ធដើម្បីលុបសំឡេងរំខាន និងព្រិលៗពី captchas ដែលព្យាយាមធ្វើឱ្យស្មុគស្មាញដល់កិច្ចការនៃប្រព័ន្ធទទួលស្គាល់តាមដែលអាចធ្វើទៅបាន។ ដំណើរការនៃការរៀបចំតម្រងសកលគឺសាមញ្ញបំផុត ហើយមានប្រាំបួនជំហាន។ នៅដំណាក់កាលនីមួយៗនៃការដំណើរការរូបភាពជាមុន ការផ្លាស់ប្តូរចំពោះរូបភាពត្រូវបានបង្ហាញ។ លើសពីនេះ ទំព័រមានសមាសធាតុផ្ទៀងផ្ទាត់ដែលអនុញ្ញាតឱ្យអ្នកវាយតម្លៃភាពត្រឹមត្រូវនៃការទទួលស្គាល់ captcha នៅពេលតម្រងត្រូវបានអនុវត្ត។ សូមក្រឡេកមើលដំណាក់កាលនីមួយៗដោយលំអិត។

ដំណាក់កាលទី 1. ការបញ្ច្រាសពណ៌

នៅដំណាក់កាលនេះ ពណ៌ភីកសែលសម្រាប់រូបភាព CAPTCHA ត្រូវបានដាក់បញ្ច្រាស។ កូដខាងក្រោមបង្ហាញពីរបៀបដែលវាកើតឡើង៖

សម្រាប់ (ភីកសែលនីមួយៗនៅក្នុង CAPTCHA) (ប្រសិនបើ (invertRed គឺពិត) ពណ៌ក្រហមថ្មី = 255 – ពណ៌ក្រហមបច្ចុប្បន្ន ប្រសិនបើ (invertBlue គឺពិត) ពណ៌ខៀវថ្មី = 255 – ពណ៌ខៀវបច្ចុប្បន្ន ប្រសិនបើ (invertGreen គឺពិត) ពណ៌បៃតងថ្មី = 255 – ពណ៌បៃតងបច្ចុប្បន្ន)

ការបញ្ច្រាសពណ៌មួយ ឬច្រើនច្រើនតែបើកលទ្ធភាពថ្មីសម្រាប់សុពលភាពរូបភាព CAPTCHA កំពុងត្រូវបានសាកល្បង។

ដំណាក់កាលទី 2. ការផ្លាស់ប្តូរពណ៌

បើក ជំហាននេះ។អ្នកអាចផ្លាស់ប្តូរសមាសធាតុពណ៌សម្រាប់ភីកសែលទាំងអស់នៅក្នុងរូបភាពមួយ។ វាលលេខនីមួយៗអាចមានតម្លៃ 257 (−1 ដល់ 255) ។ សម្រាប់សមាសធាតុ RGB នៃភីកសែលនីមួយៗ អាស្រ័យលើតម្លៃក្នុងវាល សកម្មភាពខាងក្រោមត្រូវបានអនុវត្ត៖

  1. ប្រសិនបើតម្លៃគឺ -1 នោះសមាសធាតុពណ៌ដែលត្រូវគ្នាមិនផ្លាស់ប្តូរទេ។
  2. ប្រសិនបើតម្លៃមិនមែនជា -1 នោះសមាសធាតុដែលបានរកឃើញទាំងអស់នៃពណ៌ដែលបានបញ្ជាក់ (ក្រហម បៃតង ឬខៀវ) ផ្លាស់ប្តូរទៅតាមតម្លៃដែលបានបញ្ចូលក្នុងវាល។ តម្លៃ 0 ដកសមាសធាតុចេញ តម្លៃ 255 កំណត់អាំងតង់ស៊ីតេអតិបរមារបស់វា។ល។

ដំណាក់កាលទី 3៖ មាត្រដ្ឋានប្រផេះ (មាត្រដ្ឋានប្រផេះ)

នៅជំហានទីបី រូបភាពទាំងអស់ត្រូវបានបំប្លែងទៅជារូបភាពពណ៌ប្រផេះ។ នេះជាជំហានចាំបាច់តែមួយគត់ក្នុងការបំប្លែងរូបភាពដែលមិនអាចរំលងបាន។ អាស្រ័យលើប៊ូតុងដែលបានជ្រើសរើស មួយក្នុងចំណោមខាងក្រោមត្រូវបានអនុវត្ត៖ ជំហានបន្ទាប់ភ្ជាប់ជាមួយសមាសធាតុពណ៌នៃភីកសែលនីមួយៗ៖

  1. មធ្យម -> (ក្រហម + បៃតង + ខៀវ)/៣.
  2. មនុស្ស -> (0.21 * ក្រហម + 0.71 * បៃតង + 0.07 * ខៀវ) ។
  3. មធ្យមនៃសមាសធាតុពណ៌អប្បបរមា និងអតិបរមា -> (អប្បបរមា (ក្រហម + បៃតង + ខៀវ) + អតិបរមា (ក្រហម + បៃតង + ខៀវ))/២.
  4. អប្បបរមា -> អប្បបរមា (ក្រហម + បៃតង + ខៀវ) ។
  5. អតិបរមា -> អតិបរមា (ក្រហម + បៃតង + ខៀវ) ។

អាស្រ័យលើអាំងតង់ស៊ីតេ និងការចែកចាយនៃសមាសធាតុពណ៌នៃ CAPTCHA តម្រងណាមួយអាចកែលម្អរូបភាពដែលបានស្រង់ចេញសម្រាប់ដំណើរការបន្ថែមទៀត។


ដំណាក់កាលទី 4: រលោងនិងធ្វើឱ្យច្បាស់

ដើម្បីធ្វើឱ្យវាកាន់តែពិបាកក្នុងការទាញយកអត្ថបទពីរូបភាព CAPTCHA សំឡេងរំខានត្រូវបានបន្ថែមទៅពួកវាក្នុងទម្រង់ជាចំណុចតែមួយ និងពហុភីកសែល បន្ទាត់ខាងក្រៅ និងការបង្ខូចទ្រង់ទ្រាយលំហ។ នៅពេលដែលរូបភាពត្រូវបានធ្វើឱ្យរលូន សំលេងរំខានចៃដន្យនឹងកើនឡើង ដែលបន្ទាប់មកត្រូវបានយកចេញដោយប្រើតម្រងធុង ឬ Cutoff ។ នៅក្នុងវាលលេខ Passes អ្នកគួរបញ្ជាក់ចំនួនដងដែលអ្នកត្រូវការដើម្បីអនុវត្តរបាំងរូបភាពដែលត្រូវគ្នា មុនពេលផ្លាស់ទីទៅជំហានបន្ទាប់។ សូមក្រឡេកមើលសមាសធាតុតម្រងប្រឆាំងនឹងឈ្មោះក្លែងក្លាយ និងធ្វើឱ្យច្បាស់។ របាំងរូបភាពមានពីរប្រភេទ៖

  1. របាំងថេរ។ តាមលំនាំដើម TesserCap មានរបាំងរូបភាពពេញនិយមបំផុតចំនួនប្រាំមួយ។ របាំងទាំងនេះអាចធ្វើឱ្យរូបភាពរលោង ឬធ្វើឱ្យរូបភាពកាន់តែច្បាស់ (Laplace transform)។ ការផ្លាស់ប្តូរត្រូវបានបង្ហាញភ្លាមៗបន្ទាប់ពីជ្រើសរើសរបាំងដោយប្រើប៊ូតុងដែលត្រូវគ្នា។
  2. របាំងរូបភាពផ្ទាល់ខ្លួន។ អ្នក​ប្រើ​ក៏​អាច​ដំឡើង​របាំង​កែច្នៃ​រូបភាព​ផ្ទាល់​ខ្លួន​ដោយ​បញ្ចូល​តម្លៃ​ក្នុង​វាល​ជា​លេខ ហើយ​ចុច​ប៊ូតុង Save Mask។ ប្រសិនបើផលបូកនៃមេគុណនៅក្នុងបង្អួចទាំងនេះតិចជាងសូន្យ កំហុសមួយត្រូវបានបង្កើត ហើយរបាំងមិនត្រូវបានអនុវត្តទេ។ ប្រសិនបើអ្នកជ្រើសរើសរបាំងថេរ អ្នកមិនចាំបាច់ប្រើប៊ូតុងរក្សាទុករបាំងទេ។

ដំណាក់កាលទី 5. ការណែនាំអំពីស្រមោលពណ៌ប្រផេះ

នៅដំណាក់កាលនៃដំណើរការរូបភាពនេះ ភីកសែលរបស់វាអាចមានពណ៌ ជួរធំទូលាយស្រមោលពណ៌ប្រផេះ។ តម្រងនេះបង្ហាញការចែកចាយខ្នាតប្រផេះនៃ 20 ធុង/ជួរ។ ភាគរយនៃភីកសែលដែលមានពណ៌ជាពណ៌ប្រផេះក្នុងចន្លោះពី 0 ដល់ 12 ត្រូវបានបញ្ជាក់ក្នុងធុង 0 ភាគរយនៃភីកសែលដែលមានពណ៌ពណ៌ប្រផេះក្នុងចន្លោះពី 13 ដល់ 25 ត្រូវបានបញ្ជាក់ក្នុងធុង 1 ។ល។ អ្នកប្រើប្រាស់អាចជ្រើសរើស មួយក្នុងចំណោមខាងក្រោមសម្រាប់ជួរតម្លៃពណ៌ប្រផេះនីមួយៗ៖

  1. ទុក As Is ។
  2. ជំនួសដោយពណ៌ស។
  3. ជំនួសដោយខ្មៅ។

ជាមួយនឹងជម្រើសទាំងនេះអ្នកអាចគ្រប់គ្រងបាន។ ជួរផ្សេងគ្នាស្រមោលពណ៌ប្រផេះ និងកាត់បន្ថយ/លុបសំលេងរំខានដោយការផ្លាស់ប្តូរស្រមោលពណ៌ប្រផេះទៅជាស ឬខ្មៅ។

ដំណាក់កាលទី 6. ការកំណត់ការកាត់ផ្តាច់

តម្រងនេះកំណត់ការពឹងផ្អែកនៃតម្លៃកម្រិតពណ៌ប្រផេះលើភាពញឹកញាប់នៃការកើតឡើង ហើយដាស់តឿនអ្នកឱ្យជ្រើសរើសការកាត់ផ្តាច់។ គោលការណ៍ការងារនៃតម្រងកាត់ ត្រូវបានបង្ហាញខាងក្រោមក្នុង pseudo-code៖

ប្រសិនបើ (តម្លៃមាត្រដ្ឋានប្រផេះរបស់ភីកសែល<= Cutoff) pixel grayscale value = (0 OR 255) ->អាស្រ័យលើជម្រើសមួយណាដែលត្រូវជ្រើសរើស (<= или =>៖ កំណត់រាល់ Pixel ជាមួយតម្លៃ<=/=>កម្រិតដល់ 0។ នៅសល់ដល់ 255)

ក្រាហ្វបង្ហាញការចែកចាយលម្អិតនៃភីកសែល CAPTCHA តាមពណ៌ និងជួយលុបសំលេងរំខានដោយប្រើការកាត់កម្រិតពណ៌ប្រផេះ។

ដំណាក់កាលទី 7: កាត់

បន្ទាប់ពីអនុវត្តការធ្វើឱ្យរលោង ការច្រឹប ដាក់ធុង និងតម្រងផ្សេងទៀត រូបភាព CAPTCHA អាចនៅតែគ្មានសម្លេងជាមួយនឹងចំណុចតែមួយ ឬច្រើនភីកសែល បន្ទាត់វង្វេង និងវត្ថុបុរាណក្នុងលំហ។ គោលការណ៍នៃតម្រងច្រឹបមានដូចខាងក្រោម៖ ប្រសិនបើចំនួនភីកសែលដែលនៅជាប់គ្នាដែលមានពណ៌នៅក្នុងម្លប់ពណ៌ប្រផេះដែលបានផ្តល់ឱ្យគឺតិចជាងតម្លៃនៅក្នុងវាលលេខនោះ តម្រងច្រឹបកំណត់ឱ្យពួកគេនូវតម្លៃ 0 (ខ្មៅ) ឬ 255 (ស) តាមជម្រើសរបស់អ្នកប្រើ។ ក្នុងករណីនេះ CAPTCHA ត្រូវបានវិភាគទាំងផ្ដេក និងបញ្ឈរ។

ជំហានទី 8: ផ្លាស់ប្តូរទទឹងព្រំដែន

យោងតាមអ្នកនិពន្ធរបស់ឧបករណ៍ប្រើប្រាស់ ក្នុងអំឡុងពេលនៃការស្រាវជ្រាវ និងការអភិវឌ្ឍន៍ដំបូងនៃ TesserCap គាត់បានកត់សម្គាល់ម្តងហើយម្តងទៀតថានៅពេលដែលរូបភាព CAPTCHA មានបន្ទាត់ព្រំដែនក្រាស់ ហើយពណ៌របស់វាខុសពីផ្ទៃខាងក្រោយ CAPTCHA សំខាន់ ប្រព័ន្ធ OCR មួយចំនួនមិនអាចសម្គាល់អត្ថបទបានទេ។ តម្រងនេះ។រចនាឡើងសម្រាប់ដំណើរការបន្ទាត់ព្រំដែន និងផ្លាស់ប្តូរពួកវា។ បន្ទាត់​ព្រំដែន​ដែល​មាន​ទទឹង​បញ្ជាក់​ក្នុង​វាល​លេខ​មាន​ពណ៌​ខ្មៅ ឬ​ស តាម​ជម្រើស​របស់​អ្នក​ប្រើ។

ជំហានទី 9: ការបញ្ច្រាសពណ៌ប្រផេះ

តម្រងនេះឆ្លងកាត់ភីកសែលនីមួយៗ ហើយជំនួសតម្លៃកម្រិតពណ៌ប្រផេះរបស់វាជាមួយនឹងតម្លៃថ្មីមួយ ដូចបង្ហាញក្នុងកូដក្លែងក្លាយខាងក្រោម។ ការបញ្ច្រាសពណ៌ប្រផេះត្រូវបានអនុវត្តដើម្បីឱ្យសមនឹងរូបភាព ការកំណត់ពណ៌ប្រព័ន្ធ OCR ។

សម្រាប់ (ភីកសែលនីមួយៗក្នុង CAPTCHA) តម្លៃមាត្រដ្ឋានប្រផេះថ្មី = 255 – តម្លៃមាត្រដ្ឋានប្រផេះបច្ចុប្បន្ន

ជំហានទី 10: ពិនិត្យមើលការទទួលស្គាល់ captcha

គោលដៅ ដំណាក់កាលនេះ។- ផ្ទេររូបភាព CAPTCHA ដែលបានដំណើរការមុនទៅប្រព័ន្ធ OCR សម្រាប់ការទទួលស្គាល់។ ប៊ូតុង Solve យករូបភាពបន្ទាប់ពីតម្រងបញ្ច្រាសខ្នាតប្រផេះ ផ្ញើវាទៅប្រព័ន្ធ OCR ដើម្បីស្រង់អត្ថបទ និងបង្ហាញអត្ថបទដែលបានត្រឡប់មកវិញនៅក្នុង ចំណុចប្រទាក់ក្រាហ្វិក. ប្រសិនបើអត្ថបទដែលបានទទួលស្គាល់ត្រូវគ្នានឹងអត្ថបទនៅលើ captcha វាមានន័យថាយើងបានកំណត់តម្រងត្រឹមត្រូវសម្រាប់ដំណើរការមុន។ ឥឡូវនេះ អ្នកអាចចូលទៅកាន់ផ្ទាំងជម្រើស ហើយបើកជម្រើស បើកដំណើរការរូបភាពជាមុន ដើម្បីដំណើរការ captchas ដែលបានទាញយកជាបន្តបន្ទាប់ទាំងអស់។

ទទួលស្គាល់ captchas

ជាការប្រសើរណាស់, ប្រហែលជាយើងបានពិចារណាជម្រើសទាំងអស់នៃឧបករណ៍ប្រើប្រាស់នេះហើយឥឡូវនេះវាជាការល្អដើម្បីសាកល្បង captcha មួយចំនួនសម្រាប់កម្លាំង ..


លទ្ធផលនៃគេហទំព័រវិភាគ captcha ជាមួយបឋម
ដំណើរការរូបភាព។ ការវិនិច្ឆ័យដោយលទ្ធផល, តម្រង
រកមិនឃើញទេ។

ដូច្នេះ សូមបើកដំណើរការឧបករណ៍ប្រើប្រាស់ ហើយចូលទៅកាន់គេហទំព័ររបស់ទស្សនាវដ្តី។ យើងឃើញបញ្ជីនៃព័ត៌មានចុងក្រោយបំផុត ចូលទៅកាន់ទំព័រទីមួយដែលយើងបានឃើញ ហើយរំកិលទៅកន្លែងដែលអ្នកអាចទុកមតិយោបល់របស់អ្នក។ មែនហើយ វាមិនងាយស្រួលទេក្នុងការបន្ថែមមតិយោបល់ (ជាការពិតណាស់ បើមិនដូច្នេះទេ ពួកគេនឹង spammed អ្វីៗគ្រប់យ៉ាងតាំងពីយូរយារមកហើយ) - អ្នកត្រូវបញ្ចូល captcha ។ ជាការប្រសើរណាស់, សូមពិនិត្យមើលថាតើនេះអាចត្រូវបានដោយស្វ័យប្រវត្តិ។ ចម្លង URL នៃរូបភាពហើយបិទភ្ជាប់វាទៅក្នុង របារអាសយដ្ឋាន TesserCap ។ យើងបង្ហាញថាអ្នកត្រូវទាញយក 12 captchas ហើយចុចចាប់ផ្តើម។ កម្មវិធីនេះបានផ្ទុករូបភាពចំនួន 12 ដោយស្តាប់បង្គាប់ ហើយព្យាយាមសម្គាល់ពួកគេ។ ជាអកុសល captchas ទាំងអស់មិនត្រូវបានគេទទួលស្គាល់ ដូចដែលបានបង្ហាញដោយសិលាចារឹក -Failed- នៅក្រោមពួកវា ឬត្រូវបានទទួលស្គាល់មិនត្រឹមត្រូវ។ ជាទូទៅវាមិនគួរឱ្យភ្ញាក់ផ្អើលទេចាប់តាំងពី សំលេងរំខានខាងក្រៅហើយការបង្ខូចទ្រង់ទ្រាយមិនត្រូវបានដកចេញទេ។ នេះជាអ្វីដែលយើងនឹងធ្វើឥឡូវនេះ។ ចុចកណ្ដុរស្ដាំលើរូបភាពមួយក្នុងចំណោមរូបភាពដែលបានផ្ទុកទាំង 12 ហើយផ្ញើវាទៅប្រព័ន្ធដំណើរការមុន (Send To Image Preprocessor)។ ដោយបានពិនិត្យដោយប្រុងប្រយ័ត្នទាំង 12 captchas យើងឃើញថាពួកវាមានលេខតែប៉ុណ្ណោះ ដូច្នេះយើងចូលទៅកាន់ផ្ទាំងជម្រើស ហើយបង្ហាញថាមានតែលេខប៉ុណ្ណោះដែលត្រូវទទួលស្គាល់ (សំណុំតួអក្សរ = លេខ)។ ឥឡូវ​នេះ អ្នក​អាច​ចូល​ទៅ​ផ្ទាំង​ដំណើរការ​រូបភាព​មុន​ដើម្បី​កំណត់​រចនាសម្ព័ន្ធ​តម្រង។ ខ្ញុំនឹងនិយាយភ្លាមៗថាបន្ទាប់ពីលេងជាមួយតម្រងបីដំបូង ("ការបំប្លែងពណ៌" "ការផ្លាស់ប្តូរពណ៌" "ការបន្លិចពណ៌ប្រផេះ") ខ្ញុំមិនបានឃើញឥទ្ធិពលវិជ្ជមានណាមួយទេ ដូច្នេះខ្ញុំបានទុកអ្វីៗទាំងអស់នៅទីនោះតាមលំនាំដើម។ ខ្ញុំបានជ្រើសរើស Smooth Mask 2 ហើយកំណត់ចំនួនសំបុត្រទៅមួយ។ ខ្ញុំ​បាន​រំលង​តម្រង​ធុង​ពណ៌​ប្រផេះ ហើយ​ទៅ​ត្រង់​ការ​កំណត់​ការ​ច្រឹប។ ខ្ញុំបានជ្រើសរើសតម្លៃ 154 ហើយបានបង្ហាញថាភីកសែលទាំងនោះដែលតូចជាងគួរតែត្រូវបានកំណត់ទៅ 0 ហើយភីកសែលដែលធំជាងគួរតែត្រូវបានកំណត់ទៅ 255។ ដើម្បីកម្ចាត់ភីកសែលដែលនៅសល់ ខ្ញុំបានបើកការកាត់ និងប្តូរទទឹងស៊ុមទៅជា 10។ នៅទីនោះ វាមិនមានបញ្ហាក្នុងការបើកតម្រងចុងក្រោយទេ ដូច្នេះខ្ញុំក៏ចុច Solve ភ្លាមៗ។

នៅលើ captcha ខ្ញុំមានលេខ 714945 ប៉ុន្តែកម្មវិធីបានទទួលស្គាល់វាជា 711435។ ដូចដែលអ្នកអាចឃើញគឺមិនត្រឹមត្រូវទាំងស្រុង។ នៅទីបញ្ចប់ ទោះខ្ញុំខំប្រឹងយ៉ាងណា ក៏ខ្ញុំមិនអាចស្គាល់ captcha ឱ្យបានត្រឹមត្រូវដែរ។ ខ្ញុំត្រូវពិសោធន៍ជាមួយ pastebin.com ដែលខ្ញុំអាចទទួលស្គាល់ដោយគ្មានបញ្ហាអ្វីទាំងអស់។ ប៉ុន្តែប្រសិនបើអ្នកកាន់តែឧស្សាហ៍ព្យាយាម និងអត់ធ្មត់ ហើយគ្រប់គ្រងដើម្បីទទួលបាន captchas ទទួលស្គាល់យ៉ាងត្រឹមត្រូវពីគេហទំព័រនោះ សូមចូលទៅកាន់ផ្ទាំងជម្រើស ហើយបើកដំណើរការដំណើរការរូបភាពជាមុន។ បន្ទាប់មកចូលទៅកាន់ Main ហើយដោយចុចលើ Start ទាញយកបណ្តុំថ្មីនៃ captchas ដែលឥឡូវនេះនឹងត្រូវបានដំណើរការជាមុនដោយតម្រងរបស់អ្នក។ បន្ទាប់ពីកម្មវិធីដំណើរការ សូមសម្គាល់ captchas ដែលបានទទួលស្គាល់ត្រឹមត្រូវ/មិនត្រឹមត្រូវ (សម្គាល់ថាត្រឹមត្រូវ/សម្គាល់ជាប៊ូតុងមិនត្រឹមត្រូវ)។ ចាប់ពីពេលនេះតទៅ អ្នកអាចមើលស្ថិតិសង្ខេបស្តីពីការទទួលស្គាល់ដោយប្រើ Show Statistics។ ជាទូទៅ នេះគឺជាប្រភេទនៃរបាយការណ៍ស្តីពីសុវត្ថិភាពនៃ CAPTCHA ជាក់លាក់មួយ។ ប្រសិនបើមានសំណួរអំពីការជ្រើសរើសដំណោះស្រាយមួយ ឬមួយផ្សេងទៀត នោះ ដោយមានជំនួយពី TesserCap វាពិតជាអាចធ្វើទៅបានដើម្បីធ្វើការសាកល្បងផ្ទាល់ខ្លួនរបស់អ្នក។

លទ្ធផលនៃការពិនិត្យ CAPTCHA នៅលើគេហទំព័រពេញនិយម

គេហទំព័រ និងភាគរយនៃ captchas ដែលត្រូវបានទទួលស្គាល់៖

  • វិគីភីឌា > 20–30%
  • Ebay > 20-30%
  • reddit.com > 20-30%
  • CNBC > 50%
  • foodnetwork.com > 80–90%
  • dailymail.co.uk > 30%
  • megaupload.com > 80%
  • pastebin.com > 70–80%
  • cavenue.com > 80%

សេចក្តីសន្និដ្ឋាន

រូបភាព CAPTCHA គឺជារូបភាពមួយក្នុងចំណោមរូបភាពច្រើនបំផុត យន្តការដែលមានប្រសិទ្ធភាពដើម្បីការពារកម្មវិធីគេហទំព័រពីការបំពេញទម្រង់ស្វ័យប្រវត្តិ។ ទោះជាយ៉ាងណាក៏ដោយ captchas ខ្សោយនឹងអាចការពារប្រឆាំងនឹងមនុស្សយន្តចៃដន្យ ហើយនឹងមិនទប់ទល់នឹងការប៉ុនប៉ងដែលកំណត់គោលដៅដើម្បីដោះស្រាយវានោះទេ។ ដូចជាក្បួនដោះស្រាយគ្រីប រូបភាព CAPTCHA ត្រូវបានសាកល្បង និងផ្តល់យ៉ាងហ្មត់ចត់ កម្រិតខ្ពស់សន្តិសុខគឺច្រើនបំផុត វិធីល្អបំផុតការការពារ។ ដោយផ្អែកលើស្ថិតិដែលផ្តល់ដោយអ្នកនិពន្ធនៃកម្មវិធីនេះ ខ្ញុំបានជ្រើសរើស reCaptcha សម្រាប់គម្រោងរបស់ខ្ញុំ ហើយនឹងណែនាំវាដល់មិត្តភ័ក្តិរបស់ខ្ញុំទាំងអស់ - វាប្រែទៅជាធន់បំផុតនៃអ្នកដែលបានសាកល្បង។ ក្នុងករណីណាក៏ដោយកុំភ្លេចថាមានសេវាកម្មជាច្រើននៅលើអ៊ីនធឺណិតដែលផ្តល់នូវដំណោះស្រាយ CAPTCHA ពាក់កណ្តាលស្វ័យប្រវត្តិ។ តាមរយៈ API ពិសេស អ្នកបញ្ជូនរូបភាពទៅសេវាកម្ម ហើយបន្ទាប់ពីមួយរយៈពេលខ្លី វាត្រឡប់ដំណោះស្រាយមួយ។ ដោះស្រាយ captcha មនុស្សពិត(ឧទាហរណ៍ពីប្រទេសចិន) ទទួលបានកាក់ស្អាតសម្រាប់វា។ មិនមានការការពារទៀតទេនៅទីនេះ។ 🙂