ນັກຄົ້ນຄວ້າສ້າງກ້ອງຖ່າຍຮູບທີ່ບໍ່ມີເລນ

12-10-202312-10-2023 Kenneth Campbell

ສິ່ງທີ່ເບິ່ງຄືວ່າເປັນໄປບໍ່ໄດ້ແມ່ນກາຍເປັນຄວາມເປັນຈິງ. ພວກເຮົາບໍ່ດົນມານີ້ໄດ້ຈັດພີມມາບົດຄວາມທີ່ນີ້ກ່ຽວກັບ iPhoto Channel ກ່ຽວກັບໂຄງການ metallenses, ເຕັກໂນໂລຊີປະຕິວັດທີ່ສາມາດລົບລ້າງເລນກ້ອງຖ່າຍຮູບ. ຢ່າງໃດກໍຕາມ, ມັນເປັນພຽງແຕ່ແນວຄວາມຄິດພາຍໃຕ້ການສຶກສາແລະການພັດທະນາ. ແຕ່ໃນປັດຈຸບັນ, ກຸ່ມນັກຄົ້ນຄວ້າຂອງ Tokyo Tech ໄດ້ສ້າງ ກ້ອງຖ່າຍຮູບເລນເຊີ ໃໝ່ ທີ່ໃຊ້ການຮຽນຮູ້ຂອງເຄື່ອງຈັກ ແລະ ສາມາດບັນທຶກພາບທີ່ຄົມຊັດໄດ້ໄວ ແລະ ຖືກຕ້ອງ.

“ໂດຍບໍ່ມີຂໍ້ຈຳກັດຂອງເລນ, ກ້ອງຖ່າຍຮູບທີ່ບໍ່ມີເລນສາມາດມີຂະຫນາດນ້ອຍສຸດ, ເຊິ່ງສາມາດເຮັດໃຫ້ຄໍາຮ້ອງສະຫມັກໃຫມ່ທີ່ເກີນກວ່າຈິນຕະນາການຂອງພວກເຮົາ, "ອາຈານ Masahiro Yamaguchi ຈາກສະຖາບັນເຕັກໂນໂລຢີໂຕກຽວ, ຜູ້ຮ່ວມຂຽນໂຄງການຄົ້ນຄ້ວາກ່າວ.

ເບິ່ງ_ນຳ: ຊອບແວການຟື້ນຕົວຮູບພາບແລະວິດີໂອທີ່ຖືກລົບທີ່ດີທີ່ສຸດແມ່ນຫຍັງ?

ຕົ້ນແບບກ້ອງແບບບໍ່ມີເລນສ໌ທີ່ສ້າງຂຶ້ນໂດຍນັກຄົ້ນຄວ້າເທັກໂນໂລຍີໂຕກຽວ

ແນວຄວາມຄິດຂອງກ້ອງແບບບໍ່ມີເລນແມ່ນບໍ່ແມ່ນເລື່ອງໃໝ່. ຄວາມພະຍາຍາມບາງອັນໄດ້ດໍາເນີນມາຕັ້ງແຕ່ປີ 2013. ແຕ່ເຖິງຕອນນັ້ນ, ໂຄງການຕ່າງໆໄດ້ແລ່ນເຂົ້າໄປໃນການຂາດຄວາມຄົມຊັດຂອງຮູບພາບ ແລະ ຄວາມລ່າຊ້າໃນການປະມວນຜົນຮູບ. ນັ້ນແມ່ນຍ້ອນວ່າກ້ອງຖ່າຍຮູບທີ່ບໍ່ມີເລນມີພຽງແຕ່ຫນ້າກາກບາງໆຢູ່ທາງຫນ້າຂອງເຊັນເຊີຮູບພາບທີ່ເຂົ້າລະຫັດແລະສ້າງຄືນໃຫມ່ scenes ທາງຄະນິດສາດ.

ກ້ອງແບບບໍ່ມີເລນກ່ອນໃຊ້ວິທີການຄວບຄຸມແສງທີ່ເຂົ້າມາຫາເຊັນເຊີຮູບພາບ ແລະ ປະຕິບັດການວັດແທກທີ່ຊັບຊ້ອນຂອງແສງສະທ້ອນກັບຜ້າອັດດັງ ແລະ ໜ້າກາກ.ເຊັນເຊີຮູບພາບເພື່ອກໍ່ສ້າງຮູບພາບຄືນໃໝ່. ຖ້າບໍ່ມີວິທີທີ່ຈະໂຟກັສແສງ, ກ້ອງທີ່ບໍ່ມີເລນຈະຈັບພາບທີ່ມົວໄດ້, ເຊິ່ງຈະຕ້ອງຖືກສ້າງໃໝ່ໃຫ້ເປັນຮູບທີ່ຄົມກວ່າໂດຍໃຊ້ສູດການຄິດໄລ່. ເບິ່ງອັນນີ້ໃນພາກປະຕິບັດຜ່ານຮູບຂ້າງລຸ່ມນີ້:

ຕາມຊື່ຂອງມັນຊີ້ໃຫ້ເຫັນ, ກ້ອງຖ່າຍຮູບທີ່ບໍ່ມີເລນບໍ່ໄດ້ໃຊ້ເລນ optical ແບບດັ້ງເດີມ. ແທນທີ່ຈະ, ມັນພຽງແຕ່ປະກອບມີເຊັນເຊີແລະຫນ້າກາກ. ບໍ່ມີວິທີທາງທີ່ກ້ອງຖ່າຍຮູບຈະສຸມໃສ່ແສງສະຫວ່າງໃສ່ເຊັນເຊີຮູບພາບ, ດັ່ງນັ້ນຮູບພາບລາຍລະອຽດຕ້ອງໄດ້ຮັບການສ້າງໃຫມ່ໂດຍໃຊ້ຮູບແບບທີ່ຖືກເຂົ້າລະຫັດແລະຂໍ້ມູນກ່ຽວກັບວ່າແສງສະຫວ່າງພົວພັນກັບຫນ້າກາກແລະເຊັນເຊີຮູບພາບ. Credit:Xiuxi Pan / Tokyo Institute of Technology

ໂດຍການເຂົ້າໃຈວ່າແສງມີປະຕິກິລິຍາກັບໜ້າກາກບາງໆຢູ່ໜ້າເຊັນເຊີຮູບພາບ, algorithm ສາມາດຖອດລະຫັດຂໍ້ມູນແສງໄດ້ ແລະສ້າງສາກທີ່ສຸມໃສ່ຄືນໃໝ່. ຢ່າງໃດກໍຕາມ, ຂະບວນການຖອດລະຫັດແມ່ນສິ່ງທ້າທາຍທີ່ສຸດແລະຊັບພະຍາກອນຫຼາຍ. ນອກເຫນືອຈາກການໃຊ້ເວລາ, ການສ້າງຄຸນນະພາບຮູບພາບທີ່ດີຮຽກຮ້ອງໃຫ້ມີຮູບແບບທາງດ້ານຮ່າງກາຍທີ່ສົມບູນແບບ. ຖ້າສູດການຄິດໄລ່ແມ່ນອີງໃສ່ການປະມານທີ່ບໍ່ຖືກຕ້ອງຂອງວິທີການທີ່ແສງສະຫວ່າງພົວພັນກັບຫນ້າກາກແລະເຊັນເຊີ, ລະບົບກ້ອງຖ່າຍຮູບຈະລົ້ມເຫລວ.

ແທນທີ່ຈະໃຊ້ວິທີການຖອດລະຫັດແບບຈໍາລອງ, ທີມງານຂອງ Tokyo Tech ໄດ້ພັດທະນາວິທີການຟື້ນຟູ. ດ້ວຍລະບົບວິທີໃໝ່ທີ່ໃຊ້ການຮຽນຮູ້ເຄື່ອງຈັກ. ມັນແມ່ນອີງໃສ່ເຕັກນິກທີ່ເອີ້ນວ່າວິໄສທັດTransformer (ViT) ແລະຄໍາຫມັ້ນສັນຍາປັບປຸງເຫດຜົນທົ່ວໂລກ.

ຢູ່ນີ້ພວກເຮົາສາມາດເຫັນກ້ອງຖ່າຍຮູບໃໝ່ທີ່ບໍ່ມີເລນ. ມັນປະກອບມີເຊັນເຊີຮູບພາບແລະຫນ້າກາກ 2.5 ມມຈາກເຊັນເຊີ. ຫນ້າກາກແມ່ນສ້າງຂຶ້ນໂດຍການໃສ່ໂຄມຽມໃສ່ແຜ່ນຊິລິກາສັງເຄາະ. ມັນມີຂະຫນາດຮູຮັບແສງ 40 × 40 μm. ສິນເຊື່ອ: Xiuxi Pan / Tokyo Institute of Technology

ວິທີການໃຫມ່, ການນໍາໃຊ້ເຄືອຂ່າຍ neural ແລະ transformer ເຊື່ອມຕໍ່, ສັນຍາຜົນໄດ້ຮັບທີ່ດີກວ່າ. ນອກຈາກນີ້, ຄວາມຜິດພາດໃນການກໍ່ສ້າງຄືນໃຫມ່ແມ່ນຫຼຸດລົງແລະເວລາການຄິດໄລ່ແມ່ນສັ້ນກວ່າ. ທີມງານເຊື່ອວ່າວິທີການສາມາດຖືກນໍາໃຊ້ສໍາລັບການຖ່າຍຮູບຄຸນນະພາບສູງໃນເວລາທີ່ແທ້ຈິງ, ບາງສິ່ງທີ່ເປັນໄປບໍ່ໄດ້ກັບກ້ອງຖ່າຍຮູບທີ່ບໍ່ມີເລນກ່ອນຫນ້າ. ຖ້າສິ່ງນີ້ພັດທະນາໄປອີກໃນຊຸມປີຂ້າງຫນ້າ, ພວກເຮົາຈະປະເຊີນກັບການປະຕິວັດທີ່ຍິ່ງໃຫຍ່ທີ່ສຸດໃນຂະບວນການຖ່າຍຮູບໃນປະຫວັດສາດຂອງການຖ່າຍຮູບ. ພວກເຮົາຈະຕິດຕາມ ແລະນຳເອົາຂ່າວຂອງກ້ອງທີ່ບໍ່ມີເລນມາໃຫ້ທ່ານສະເໝີ.

ອ່ານບົດສະຫຼຸບຂອງການສຶກສາທີ່ພິມເຜີຍແຜ່ໂດຍຜູ້ຂຽນຂອງການຄົ້ນຄວ້າ Xuixi Pan, Xiao Chen, Saori Takeyama ແລະ Masahiro Yamaguchi:

ກ້ອງແບບບໍ່ມີແວ່ນຕາແບບບໍ່ມີແວ່ນຕາຈະເຂົ້າລະຫັດສາກດ້ວຍໜ້າກາກບາງໆ ແລະສ້າງຮູບຄືນໃໝ່ຫຼັງຈາກນັ້ນ. ການປັບປຸງການສ້າງຮູບພາບໃຫມ່ແມ່ນຫນຶ່ງໃນບັນຫາທີ່ສໍາຄັນທີ່ສຸດໃນການຖ່າຍຮູບທີ່ບໍ່ມີທັດສະນະ. ວິທີການຟື້ນຟູທີ່ອີງໃສ່ແບບທໍາມະດາ, ທີ່ນໍາໃຊ້ຄວາມຮູ້ກ່ຽວກັບລະບົບທາງດ້ານຮ່າງກາຍ, ມີຄວາມອ່ອນໄຫວຕໍ່ກັບການສ້າງແບບຈໍາລອງທີ່ບໍ່ສົມບູນແບບຂອງລະບົບ.

ເບິ່ງ_ນຳ: ຮູບພາບທີ່ເບິ່ງຫຼາຍທີ່ສຸດໃນປະຫວັດສາດແມ່ນຫຍັງ?

ການສ້າງຄືນໃໝ່ດ້ວຍເຄືອຂ່າຍປະສາດເລິກທີ່ຂັບເຄື່ອນດ້ວຍຂໍ້ມູນອັນບໍລິສຸດ (DNN) ຫຼີກລ່ຽງຂໍ້ຈຳກັດນີ້, ດັ່ງນັ້ນຈຶ່ງມີຄວາມສາມາດໃນການໃຫ້ຄຸນນະພາບການຟື້ນຟູທີ່ດີຂຶ້ນ. ຢ່າງໃດກໍ່ຕາມ, ວິທີການຟື້ນຟູ DNN ທີ່ບໍລິສຸດທີ່ມີຢູ່ແລ້ວສໍາລັບຮູບພາບທີ່ບໍ່ມີທັດສະນະບໍ່ໄດ້ໃຫ້ຜົນໄດ້ຮັບທີ່ດີກ່ວາວິທີການທີ່ອີງໃສ່ແບບຈໍາລອງ.

ພວກເຮົາເປີດເຜີຍໃຫ້ເຫັນວ່າຄຸນສົມບັດຂອງ multiplexing ໃນ optics ທີ່ບໍ່ມີເລນເຮັດໃຫ້ຄຸນສົມບັດທົ່ວໂລກທີ່ຈໍາເປັນໃນການເຂົ້າໃຈຮູບແບບ optically encoded. ນອກຈາກນັ້ນ, ວິທີການຟື້ນຟູ DNN ທີ່ມີຢູ່ທັງຫມົດນໍາໃຊ້ເຄືອຂ່າຍ convolutional ຢ່າງເຕັມສ່ວນ (FCNs) ທີ່ບໍ່ມີປະສິດທິພາບໃນລັກສະນະທົ່ວໂລກທີ່ສົມເຫດສົມຜົນ.

ດ້ວຍການວິເຄາະນີ້, ເປັນຄັ້ງທໍາອິດເທົ່າທີ່ພວກເຮົາຮູ້, ເຄືອຂ່າຍ neural ທີ່ເຊື່ອມຕໍ່ຢ່າງເຕັມສ່ວນກັບ transformer ສໍາລັບການຟື້ນຟູຮູບພາບໄດ້ຖືກສະເຫນີ. ສະຖາປັດຕະຍະກໍາທີ່ສະເຫນີແມ່ນດີກວ່າໃນການສົມເຫດສົມຜົນຂອງຊັບພະຍາກອນທົ່ວໂລກແລະດັ່ງນັ້ນຈຶ່ງປັບປຸງການກໍ່ສ້າງໃຫມ່. ຄວາມດີກວ່າຂອງສະຖາປັດຕະຍະກໍາທີ່ສະເຫນີແມ່ນໄດ້ຮັບການຢັ້ງຢືນໂດຍການປຽບທຽບມັນກັບວິທີການທີ່ອີງໃສ່ແບບຈໍາລອງແລະ FCN ໃນການທົດລອງ optical. ແລະດັ່ງນັ້ນຈຶ່ງປັບປຸງການຟື້ນຟູ.

ຄວາມເໜືອກວ່າຂອງສະຖາປັດຕະຍະກຳທີ່ສະເໜີມາແມ່ນໄດ້ຮັບການຢັ້ງຢືນໂດຍການປຽບທຽບວິທີການທີ່ອີງໃສ່ແບບຈຳລອງ ແລະ FCN ໃນການທົດລອງທາງແສງ. ມັນແມ່ນ,ດັ່ງນັ້ນ, ມັນປັບປຸງການຟື້ນຟູ. ຄວາມດີເລີດຂອງສະຖາປັດຕະຍະກຳທີ່ສະເໜີມານັ້ນແມ່ນໄດ້ຮັບການຢັ້ງຢືນໂດຍການປຽບທຽບກັບວິທີການທີ່ອີງໃສ່ແບບຈຳລອງ ແລະ FCN ໃນການທົດລອງທາງແສງ.