អ្នកស្រាវជ្រាវ បង្កើតកាមេរ៉ាដោយគ្មានកញ្ចក់
![អ្នកស្រាវជ្រាវ បង្កើតកាមេរ៉ាដោយគ្មានកញ្ចក់](/wp-content/uploads/tend-ncia/2832/18txfb8zk7.jpg)
អ្វីដែលហាក់ដូចជាមិនអាចទៅរួចគឺក្លាយទៅជាការពិត។ ថ្មីៗនេះ យើងបានបង្ហោះអត្ថបទមួយនៅទីនេះនៅលើ iPhoto Channel អំពីគម្រោង metallenses ដែលជាបច្ចេកវិទ្យាបដិវត្តន៍ដែលអាចលុបបំបាត់កញ្ចក់កាមេរ៉ាបាន។ ទោះជាយ៉ាងណា វាគ្រាន់តែជាគំនិតដែលស្ថិតក្រោមការសិក្សា និងការអភិវឌ្ឍប៉ុណ្ណោះ។ ប៉ុន្តែឥឡូវនេះ ក្រុមអ្នកស្រាវជ្រាវនៅ Tokyo Tech បានបង្កើត កាមេរ៉ាគ្មានកញ្ចក់ ថ្មីដែលប្រើ machine learning ហើយអាចចាប់យករូបភាពច្បាស់បានយ៉ាងរហ័ស និងត្រឹមត្រូវ។
“បើគ្មានដែនកំណត់នៃកែវថតទេ នោះ កាមេរ៉ាគ្មានកញ្ចក់អាចមានទំហំតូចបំផុត ដែលអាចបើកកម្មវិធីថ្មីដែលហួសពីការស្មានរបស់យើង” សាស្ត្រាចារ្យ Masahiro Yamaguchi នៃវិទ្យាស្ថានបច្ចេកវិទ្យាតូក្យូ ដែលជាសហអ្នកនិពន្ធគម្រោងស្រាវជ្រាវ។
![](/wp-content/uploads/tend-ncia/2832/18txfb8zk7.jpg)
គំនិតនៃកាមេរ៉ាគ្មានកញ្ចក់គឺមិនថ្មីទេ។ ការប៉ុនប៉ងមួយចំនួនត្រូវបានធ្វើឡើងរួចហើយចាប់តាំងពីឆ្នាំ 2013។ ប៉ុន្តែរហូតមកដល់ពេលនោះ គម្រោងនានាបានដំណើរការទៅដោយកង្វះភាពច្បាស់នៃរូបភាព និងការពន្យារពេលក្នុងដំណើរការរូបថត។ នោះក៏ព្រោះតែកាមេរ៉ាដែលគ្មានកែវថត មានរបាំងស្តើងនៅពីមុខឧបករណ៍ចាប់សញ្ញារូបភាព ដែលធ្វើការអ៊ិនកូដ និងបង្កើតឡើងវិញនូវឈុតឆាកតាមបែបគណិតវិទ្យា។
កាមេរ៉ាគ្មានកញ្ចក់ពីមុនបានប្រើវិធីសាស្រ្តដើម្បីគ្រប់គ្រងពន្លឺដែលប៉ះឧបករណ៍ចាប់សញ្ញារូបភាព និងធ្វើការវាស់វែងយ៉ាងស្មុគ្រស្មាញនៃរបៀបដែលពន្លឺមានអន្តរកម្មជាមួយរបាំងរាងកាយ និងឧបករណ៍ចាប់សញ្ញារូបភាព ដើម្បីបង្កើតរូបភាពឡើងវិញ។ បើគ្មានវិធីដើម្បីផ្ដោតពន្លឺទេ កាមេរ៉ាគ្មានកែវថតចាប់យករូបភាពមិនច្បាស់ ដែលត្រូវតែបង្កើតឡើងវិញទៅជារូបភាពច្បាស់ជាងមុនដោយប្រើក្បួនដោះស្រាយ។ សូមមើលវានៅក្នុងការអនុវត្តតាមរយៈរូបភាពខាងក្រោម៖
![](/wp-content/uploads/tend-ncia/2832/18txfb8zk7.jpeg)
ដោយការយល់ដឹងពីរបៀបដែលពន្លឺធ្វើអន្តរកម្មជាមួយរបាំងស្តើងនៅពីមុខឧបករណ៍ចាប់សញ្ញារូបភាព ក្បួនដោះស្រាយអាចឌិកូដព័ត៌មានពន្លឺ និងបង្កើតឈុតដែលផ្តោតឡើងវិញ។ ទោះយ៉ាងណាក៏ដោយ ដំណើរការឌិកូដមានការលំបាកខ្លាំង ហើយធនធានដែលពឹងផ្អែកខ្លាំង។ បន្ថែមពីលើការចំណាយពេល ការបង្កើតគុណភាពរូបភាពល្អតម្រូវឱ្យមានគំរូរូបវន្តដ៏ល្អឥតខ្ចោះ។ ប្រសិនបើក្បួនដោះស្រាយផ្អែកលើការប៉ាន់ស្មានមិនត្រឹមត្រូវនៃរបៀបដែលពន្លឺធ្វើអន្តរកម្មជាមួយរបាំងមុខ និងឧបករណ៍ចាប់សញ្ញានោះ ប្រព័ន្ធកាមេរ៉ានឹងបរាជ័យ។
ជំនួសឱ្យការប្រើវិធីសាស្រ្តឌិកូដផ្អែកលើគំរូ ក្រុមការងារនៅ Tokyo Tech បានបង្កើតវិធីសាស្ត្រស្ថាបនាឡើងវិញ។ ជាមួយនឹងក្បួនដោះស្រាយថ្មីដែលប្រើការរៀនម៉ាស៊ីន។ វាត្រូវបានផ្អែកលើបច្ចេកទេសហៅថា VisionTransformer (ViT) និងការសន្យាធ្វើអោយប្រសើរឡើងនូវហេតុផលសកល។
![](/wp-content/uploads/tend-ncia/2832/18txfb8zk7-1.jpeg)
វិធីសាស្រ្តថ្មី ដោយប្រើបណ្តាញសរសៃប្រសាទ និងឧបករណ៍បំប្លែងដែលបានតភ្ជាប់ សន្យាថានឹងមានលទ្ធផលប្រសើរជាងមុន។ ដូចគ្នានេះផងដែរ, កំហុសក្នុងការកសាងឡើងវិញត្រូវបានកាត់បន្ថយ ហើយពេលវេលាគណនាគឺខ្លីជាង។ ក្រុមការងារជឿជាក់ថា វិធីសាស្ត្រនេះអាចត្រូវបានប្រើសម្រាប់ការចាប់យករូបភាពដែលមានគុណភាពខ្ពស់ក្នុងពេលវេលាជាក់ស្តែង ដែលជាអ្វីដែលមិនអាចធ្វើទៅបានជាមួយកាមេរ៉ាគ្មានកញ្ចក់ពីមុន។ ប្រសិនបើរឿងនេះពិតជាមានការវិវត្តបន្ថែមទៀតនៅក្នុងប៉ុន្មានឆ្នាំខាងមុខនេះ យើងនឹងប្រឈមមុខនឹងបដិវត្តន៍ដ៏អស្ចារ្យបំផុតមួយនៅក្នុងដំណើរការចាប់យករូបភាពនៅក្នុងប្រវត្តិសាស្រ្តនៃការថតរូប។ យើងនឹងតាមដាន ហើយតែងតែនាំមកជូនអ្នកនូវព័ត៌មានអំពីកាមេរ៉ាដោយគ្មានកញ្ចក់។
សូមមើលផងដែរ: ល្បិចគួរឱ្យស្អប់ខ្ពើមទាំង ១០ ដែលប្រើដើម្បីថតរូបអាហារសូមអានសេចក្តីសង្ខេបនៃការសិក្សាដែលបានបោះពុម្ពផ្សាយដោយអ្នកនិពន្ធនៃការស្រាវជ្រាវ Xuixi Pan, Xiao Chen, Saori Takeyama និង Masahiro Yamaguchi៖
កាមេរ៉ាគ្មានកញ្ចក់ដែលមានមូលដ្ឋានលើរបាំងមុខ អ៊ិនកូដកន្លែងកើតហេតុដោយប្រើរបាំងស្តើង ហើយបង្កើតរូបភាពឡើងវិញនៅពេលក្រោយ។ ការកែលម្អការបង្កើតរូបភាពឡើងវិញគឺជាបញ្ហាសំខាន់បំផុតមួយក្នុងការថតរូបដោយគ្មានកញ្ចក់។ វិធីសាស្រ្តស្ថាបនាឡើងវិញដោយផ្អែកលើគំរូសាមញ្ញ ដែលមានឥទ្ធិពលលើចំនេះដឹងនៃប្រព័ន្ធរូបវន្ត គឺងាយនឹងធ្វើគំរូមិនល្អឥតខ្ចោះនៃប្រព័ន្ធ។
សូមមើលផងដែរ: រូបភាព ឬមួយពាន់ពាក្យ? ការផ្ទុះភ្នំភ្លើងក្លាយជាផ្ទៃខាងក្រោយសម្រាប់រូបថតអាពាហ៍ពិពាហ៍ការកសាងឡើងវិញជាមួយនឹងបណ្តាញសរសៃប្រសាទជ្រៅដែលជំរុញដោយទិន្នន័យសុទ្ធ (DNN) ជៀសវាងការកំណត់នេះ ដូច្នេះមានសក្តានុពលក្នុងការផ្តល់នូវគុណភាពនៃការសាងសង់ឡើងវិញកាន់តែប្រសើរ។ ទោះជាយ៉ាងណាក៏ដោយ វិធីសាស្រ្តបង្កើតឡើងវិញនៃ DNN សុទ្ធដែលមានស្រាប់សម្រាប់រូបភាពដែលគ្មានកញ្ចក់មិនផ្តល់លទ្ធផលប្រសើរជាងវិធីសាស្រ្តផ្អែកលើគំរូនោះទេ។
យើងបង្ហាញថាលក្ខណៈពហុគុណក្នុងអុបទិកគ្មានកញ្ចក់ធ្វើឱ្យលក្ខណៈសកលមានសារៈសំខាន់ក្នុងការយល់ដឹងអំពីលំនាំអ៊ិនកូដអុបទិក។ លើសពីនេះ វិធីសាស្រ្តកសាងឡើងវិញ DNN ដែលមានស្រាប់ទាំងអស់អនុវត្តបណ្តាញបំប្លែងពេញលេញ (FCNs) ដែលមិនមានប្រសិទ្ធភាពក្នុងការវែកញែកអំពីលក្ខណៈសកល។
ជាមួយនឹងការវិភាគនេះ ជាលើកដំបូងតាមដែលយើងដឹង បណ្តាញសរសៃប្រសាទដែលបានតភ្ជាប់យ៉ាងពេញលេញជាមួយនឹង transformer សម្រាប់ការបង្កើតរូបភាពឡើងវិញត្រូវបានស្នើឡើង។ ស្ថាបត្យកម្មដែលបានស្នើឡើងគឺប្រសើរជាងក្នុងការវែកញែកធនធានសកល ហើយដូច្នេះធ្វើអោយប្រសើរឡើងនូវការកសាងឡើងវិញ។ ឧត្តមភាពនៃស្ថាបត្យកម្មដែលបានស្នើឡើងត្រូវបានផ្ទៀងផ្ទាត់ដោយការប្រៀបធៀបវាជាមួយនឹងវិធីសាស្រ្តផ្អែកលើគំរូ និង FCN ក្នុងការពិសោធន៍អុបទិក។ ដូច្នេះហើយ ធ្វើអោយប្រសើរឡើងនូវការកសាងឡើងវិញ។
ឧត្តមភាពនៃស្ថាបត្យកម្មដែលបានស្នើឡើងត្រូវបានផ្ទៀងផ្ទាត់ដោយការប្រៀបធៀបវិធីសាស្រ្តផ្អែកលើគំរូ និង FCN ក្នុងការពិសោធន៍អុបទិក។ វាគឺជាការ,ដូច្នេះវាធ្វើអោយប្រសើរឡើងនូវការកសាងឡើងវិញ។ ឧត្តមភាពនៃស្ថាបត្យកម្មដែលបានស្នើឡើងត្រូវបានផ្ទៀងផ្ទាត់ដោយការប្រៀបធៀបវាជាមួយនឹងវិធីសាស្រ្តផ្អែកលើគំរូ និង FCN ក្នុងការពិសោធន៍អុបទិក។