ai-agents-for-beginners

ការបង្កើតភ្នាក់ងារប្រើកុំព្យូទ័រ (CUA)

ភ្នាក់ងារប្រើកុំព្យូទ័រអាចធ្វើអន្តរកម្មជាមួយគេហទំព័រដូចនឹងមនុស្សម្នាក់ ដោយបើកកម្មវិធីរុករកទំព័រ ពិនិត្យមើលទំព័រ ហើយអនុវត្តន៍សកម្មភាពល្អបំផុតបន្ទាប់ពីបានមើលឃើញ។ នៅក្នុងមេរៀននេះ អ្នកនឹងបង្កើតភ្នាក់ងាររុករកដែលស្វែងរក Airbnb, ដកទិន្នន័យបញ្ជីដែលមានរចនាសម្ព័ន្ធ ហើយកំណត់ទីកន្លែងស្នាក់នៅថោកបំផុតនៅក្នុងទីក្រុង Stockholm។

មេរៀននេះបង្កប់ការប្រើប្រាស់ Browser-Use សម្រាប់ការរុករកដោយ AI, Playwright និង Chrome DevTools Protocol (CDP) សម្រាប់ការគ្រប់គ្រងកម្មវិធីរុករក, Azure OpenAI សម្រាប់ការវិភាគដោយចក្ខុវិស័យ និង Pydantic សម្រាប់ការដកទិន្នន័យដែលមានរចនាសម្ព័ន្ធ។

ការណែនាំ

មេរៀននេះនឹងគ្របដណ្តប់៖

គោលបំណងត្រូវរៀន

បន្ទាប់ពីបញ្ចប់មេរៀននេះ អ្នកនឹងដឹងវិធី៖

ឧទាហរណ៍កូដ

មេរៀននេះមានមេរៀនតែមួយក្នុងសៀវភៅកំណត់ត្រា៖

ការត្រៀមខ្លួន

ការតំឡើង

តំឡើងកញ្ចប់ដែលបានប្រើនៅក្នុងសៀវភៅកំណត់ត្រា៖

pip install browser_use playwright python-dotenv
playwright install chromium

កំណត់អថេរបរិស្ថាន Azure OpenAI ដែលបានប្រើនៅក្នុងសៀវភៅកំណត់ត្រា៖

AZURE_OPENAI_ENDPOINT=...
AZURE_OPENAI_API_KEY=...
AZURE_OPENAI_CHAT_DEPLOYMENT_NAME=...
# ជាជម្រើស ៖ អភិប្រាប់ទៅកាន់កំណត់ភាគ API ថ្មីបំផុតនៅពេលមិនបានបញ្ជាក់
AZURE_OPENAI_API_VERSION=...

ទិដ្ឋភាពទូទៅនៃស្ថาปត្យវិទ្យា

សៀវភៅកំណត់ត្រានេះបង្ហាញពីដំណើរការអូតូម៉ាស៊ីកម្មវិធីរុករកចម្រុះ៖

  1. Chrome ចាប់ផ្តើមដោយបើក CDP ដូច្នេះ Playwright និង Browser-Use អាចចែករំលែកសម័យរុករកដូចគ្នា។
  2. ភ្នាក់ងារប្រើ Browser-Use គ្រប់គ្រងភារកិច្ចរុករកដែលបើកចំហផ្ទាល់ ដូចជា បើក Airbnb, បិទបង្អួចផ្ទាំងផ្សាយពាណិជ្ជកម្ម, និងស្វែងរក Stockholm។
  3. ទំព័រដែលសកម្ម ត្រូវបានពិនិត្យជាមួយស្កីម៉ាផ្លូវការពី Pydantic ដើម្បីដកចំណងជើងបញ្ជី តម្លៃរាត្រី ពិន្ទុ និង URL។
  4. បច្ចេកវិទ្យាភីថាញ់ប្រៀបធៀបបញ្ជីដែលបានដក និងបញ្ចាំងលទ្ធផលថោកបំផុត។

វិធីសាស្ត្រនេះរក្សាទុកការត្រួតពិនិត្យដោយចក្ខុវិស័យដែលមានភាពបត់បែនដែល Browser-Use ល្អចំពោះវា ខណៈផ្តល់កំលាំងក្នុងការគ្រប់គ្រងកម្មវិធីរុករកដែលមានល្បឿនថ្្ចតពេលដែលអ្នកត្រូវការ។

ចំណុចសំខាន់ និងអនុវត្តន៍ល្អបំផុត

ពេលណាដើម្បីប្រើភ្នាក់ងារ បរិបូណ៍អ្នកសម្តែង

ស្ថានភាព ប្រើភ្នាក់ងារ ប្រើអ្នកសម្តែង
រចនាសម្ព័ន្ធញ័រ បាទ/ចាស, AI អាចអនុវត្តឲ្យសម្រួលទៅការផ្លាស់ប្តូរទំព័រ ទេ, ជ្រើសរើសដែលងាយខូចធ្វើឲ្យខូច
រចនាសម្ព័ន្ធដែលបានដឹង ទេ, ភ្នាក់ងារយឺតជាងការត្រួតផ្ទាល់ បាទ/ចាស, លឿន និងច្បាស់លាស់
ស្វែងរកធាតុ បាទ/ចាស, ភាសា​ធម្មជាតិដំណើរការល្អ ទេ, តម្រូវជ្រើសរើសត្រឹមត្រូវ
គ្រប់គ្រងពេលវេលា ទេ, អាចមិនទាន់ទស្សន៍ទាយបាន បាទ/ចាស, គ្រប់គ្រងពេញលេញលើការរង់ចាំ និងព្យាយាមម្តងទៀត
ដំណើរការលំបាក បាទ/ចាស, ដំណើរការចំណុច UI មិនគិតពីរបៀបដែលមិនបង្ហាញ ទេ, តម្រូវការប branching បញ្ជាក់

អនុវត្តន៍ល្អបំផុត Browser-Use

  1. ចាប់ផ្តើមជាមួយភ្នាក់ងារសម្រាប់ការស្វែងរក និងការរុករកញ័រ។
  2. ផ្លាស់ទៅគ្រប់គ្រងទំព័រ​តាមផ្ទាល់ពេលដែលអន្តរកម្មកាន់តែអាចទស្សន៍ទាយបាន។
  3. ប្រើម៉ូដែលលទ្ធផលដែលមានរចនាសម្ព័ន្ធ ដូច្នេះទិន្នន័យដែលបានដកត្រូវបានផ្ទៀងផ្ទាត់ និងមានប្រភេទសុរាប់
  4. បន្ថែមការពន្យារពេលយ៉ាងខ្លាំងបន្ទាប់ពីសកម្មភាពដែលបង្កើតបម្រែបម្រួល UI ដែលមើលឃើញ
  5. ចាប់យករូបភាពអេក្រង់ក្នុងអំឡុងពេល Iteration ដើម្បីឲ្យករណីខូចខាតងាយស្រួលដោះស្រាយ
  6. រំពឹងថាគេហទំព័រអាចផ្លាស់ប្តូរ និងរចនាសម្ព័ន្ធយុទ្ធសាស្ត្របម្រុងទុក​សម្រាប់បង្អួចផ្សាយពាណិជ្ជកម្ម និងការផ្លាស់ប្តូរសម្រួល
  7. រួមបញ្ចូលគំរូភ្នាក់ងារ និងអ្នកសម្តែង ដើម្បីទទួលបានទាំងភាពបត់បែន និងភាពខ្ជាប់ខ្ជួន

ករណីប្រើប្រាស់ពិតប្រាកដ

ឯកសារបន្ថែម


ការ​ដោះលែង​ពីកាតព្វកិច្ច៖ ឯកសារនេះត្រូវបានបកប្រែដោយប្រើសេវាបកប្រែ AI Co-op Translator។ ខណៈដែលយើងខំប្រឹងសំរាប់ភាពត្រឹមត្រូវ សូមជ្រាបថាការបកប្រែដោយស្វ័យប្រវត្តិអាចមានកំហុស ឬការមិនត្រឹមត្រូវ។ ឯកសារដើមនៅក្នុងភាសាទីតាំងគួរត្រូវបានពិចារណាថាជាអ្នកផ្តល់ព័ត៍មានដែលមានអំណាច។ សម្រាប់ព័ត៌មានសំខាន់ ការបកប្រែដោយអ្នកវិជ្ជាជីវៈមនុស្សត្រូវបានផ្ដល់អនុសាសន៍។ យើងមិនទទួលខុសត្រូវចំពោះការយល់ច្រឡំ ឬការបកប្រែខុសពីការប្រើប្រាស់ការបកប្រែនេះឡើយ។