Menginstruksikan Robot dan Drone, Microsoft Gunakan ChatGPT!
ChatGPT dari OpenAI tidak hanya bagus dalam menghasilkan respon teks yang koheren terhadap permintaan dengan bahasa yang alami dan mudah dipahami, tapi ia juga mampu berperan penting dalam interaksi manusia-robot dan menggunakan umpan balik sensor untuk menulis kode untuk tindakan robot.
Microsoft baru-baru ini melakukan penelitian untuk "melihat apakah ChatGPT dapat berpikir di luar teks, dan merenungkan tentang dunia fisik untuk membantu tugas-tugas robotika." Tujuannya adalah untuk melihat apakah orang dapat menggunakan ChatGPT untuk menginstruksikan robot tanpa harus belajar bahasa pemrograman atau memahami sistem robotik.
"Masalah utama di sini adalah mengajarkan ChatGPT cara memecahkan masalah dengan mempertimbangkan hukum fisika, konteks lingkungan operasi, dan bagaimana tindakan fisik robot dapat mengubah keadaan dunia", tim dari Microsoft Autonomous Systems and Robotics Research mencatat dalam sebuah blogpost.
Para peneliti Microsoft mengeksplorasi kemampuan ChatGPT dalam menghasilkan kode, terutama dalam Python, untuk skenario robotika, seperti perencanaan dan generasi kode tanpa ajaran, setelah ChatGPT diberikan akses ke data deteksi objek dan jarak objek melalui antarmuka aplikasi.
Dalam penelitiannya, Microsoft menemukan bahwa ChatGPT memiliki kemampuan untuk menghasilkan kode-kode yang dapat dipakai dalam skenario robotik dengan memanfaatkan data yang didapatkan melalui antarmuka aplikasi, seperti deteksi objek dan jarak objek. Hal ini dikarenakan ChatGPT telah dilatih pada sejumlah besar kode dan teks tulisan, sehingga mampu menyelesaikan masalah pemrograman dan memperbaiki program, serta memberikan respons dan penjelasan saat diperlukan.
(ChatGPT dapat menghasilkan kode karena ia dilatih dengan jumlah besar kode dan teks yang ditulis. Sistem ini terbukti mampu memecahkan masalah pemrograman dan melakukan debugging program, dengan kemampuan unik tambahan yaitu merespons dialog dan mencari klarifikasi. Ada juga Codex, model berbasis GPT-3 dari OpenAI yang menjadi dasar layanan pemrograman berpasangan Copilot GitHub, yang otomatis melengkapi kode untuk pengembang dalam beberapa bahasa.)
Dengan kemampuan dalam dialog dan penjelasan ini, Microsoft menguji kemampuan ChatGPT sebagai antarmuka berbasis bahasa antara pengguna non-teknis dan drone. Para peneliti mencatat dalam makalah mereka bahwa meskipun GPT-3, LaMDA, dan Codex menunjukkan potensi dalam tugas perencanaan dan pembuatan kode robotik, ChatGPT secara khusus adalah "alat yang mungkin lebih serbaguna untuk domain robotik, karena menggabungkan kekuatan dari model bahasa alami dan pembuatan kode bersama dengan fleksibilitas dialog."
Dalam penelitian tersebut, ChatGPT juga diuji untuk menggunakan sebuah lengan robotik untuk memindahkan blok-blok dan membentuk logo Microsoft. Para peneliti juga memberikan tugas pada ChatGPT untuk menulis algoritma bagi sebuah drone untuk mencapai suatu titik tanpa menabrak halangan. Mereka juga menguji apakah ChatGPT dapat memutuskan arah gerakan robot berdasarkan umpan balik sensor secara real-time.
Para peneliti mencatat dalam blog post mereka: "ChatGPT meminta pertanyaan klarifikasi ketika instruksi pengguna ambigu, dan menulis struktur kode kompleks untuk drone seperti pola zig-zag untuk memeriksa rak secara visual."
Para peneliti di Google Research dan Everyday Robots yang dimiliki oleh Alphabet juga telah bekerja pada tantangan robotik serupa dengan menggunakan model bahasa besar yang disebut PaLM, atau Pathways Language Model, yang membantu robot untuk memproses permintaan yang bersifat terbuka dan memberikan respons yang wajar.
Kesimpulan atau poin-poin penting dalam artikel ini yang lebih mudah dipahami:
- ChatGPT dari OpenAI mampu berperan penting dalam interaksi manusia-robot dan menggunakan umpan balik sensor untuk menulis kode untuk tindakan robot.
- Microsoft melakukan penelitian untuk menginstruksikan robot menggunakan ChatGPT tanpa harus belajar bahasa pemrograman atau memahami sistem robotik.
- Microsoft mengeksplorasi kemampuan ChatGPT dalam menghasilkan kode-kode untuk skenario robotika, seperti perencanaan dan generasi kode tanpa ajaran, setelah diberikan akses ke data deteksi objek dan jarak objek melalui antarmuka aplikasi.
- ChatGPT telah dilatih pada sejumlah besar kode dan teks tulisan sehingga mampu menyelesaikan masalah pemrograman dan memperbaiki program serta memberikan respons dan penjelasan saat diperlukan.
- ChatGPT diuji sebagai antarmuka berbasis bahasa antara pengguna non-teknis dan drone dengan kemampuan dalam dialog dan penjelasan yang baik.
- ChatGPT diuji untuk menggunakan sebuah lengan robotik untuk memindahkan blok-blok dan membentuk logo Microsoft serta menulis algoritma bagi sebuah drone untuk mencapai suatu titik tanpa menabrak halangan.
- Para peneliti di Google Research dan Everyday Robots yang dimiliki oleh Alphabet juga telah bekerja pada tantangan robotik serupa dengan menggunakan model bahasa besar yang disebut PaLM, atau Pathways Language Model, yang membantu robot untuk memproses permintaan yang bersifat terbuka dan memberikan respons yang wajar.