--> -->

Google Luncurkan AI yang Bisa Coba Pakaian Secara Virtual

google-luncurkan-ai-yang-bisa-coba-pakaian-secara-virtual
Image source: Google

Google telah mengumumkan fitur terbaru yang dapat mengubah pengalaman berbelanja pakaian secara daring. Fitur tersebut bernama "virtual try-on" atau mencoba pakaian virtual. 

Dengan menggunakan fitur ini, pengguna dapat dengan jelas melihat bagaimana pakaian akan menyesuaikan dan berinteraksi dengan tubuh model. Pengguna dapat memperhatikan dengan detail bagaimana pakaian tersebut akan terlihat saat dipakai, termasuk bagaimana pakaian bergerak, melipat, menempel, meregang, dan berkerut sesuai dengan bentuk tubuh model.

Untuk mewujudkan fitur ini, para peneliti kecerdasan buatan (AI) di Google Shopping mengembangkan model AI generatif baru yang menghasilkan gambar-gambar realistis dari pakaian yang dikenakan oleh manusia.

Mari kita lihat lebih dekat model AI baru ini dan bagaimana tepatnya fitur coba pakaian virtual (VTO) ini berfungsi.

Menghasilkan gambar coba pakaian dengan AI

mencoba-pakaian-secara-virtual-dengan-google-ai
Image source: Google

Teknik Virtual Try-On (VTO) yang terkenal ini terinspirasi dari film "Clueless". Sejak itu, telah ada perkembangan yang signifikan dalam teknik ini. Saat ini, dengan menggunakan perubahan geometri, gambar pakaian dapat dipotong, ditempelkan, dan diubah bentuknya agar sesuai dengan siluet tubuh. Meskipun demikian, hasil akhirnya belum sepenuhnya realistis. Pakaian tidak secara realistis menyesuaikan dengan bentuk tubuh, dan terdapat cacat visual seperti lipatan yang salah, sehingga pakaian terlihat tidak berbentuk dan tidak alami.

Oleh karena itu, saat memutuskan untuk membangun fitur VTO baru, tujuan utamanya adalah menghasilkan gambar pakaian dengan kualitas tinggi dan realistis. Dalam pengembangan ini, ditemukan pendekatan baru yang menggunakan model AI yang disebut difusi.

Untuk memahami cara kerja model ini, mari kita jelaskan terlebih dahulu tentang difusi. Difusi adalah proses secara bertahap menambahkan piksel tambahan (atau "noise") ke dalam sebuah gambar hingga gambar tersebut menjadi tidak dikenali - kemudian menghapus noise secara keseluruhan hingga gambar asli direkonstruksi dengan kualitas sempurna. Model teks-ke-gambar seperti Imagen menggunakan difusi ditambah teks dari model bahasa besar (LLM) untuk menghasilkan gambar realistis berdasarkan teks yang pengguna masukkan.

Terinspirasi oleh Imagen, Google memutuskan untuk menggunakan difusi dalam VTO - tetapi dengan perubahan. Alih-alih menggunakan teks sebagai input selama difusi, Google menggunakan sepasang gambar: satu gambar pakaian dan satu gambar orang yang mengenakan pakaian tersebut. Setiap gambar dikirim ke neural network sendiri (U-net) dan saling berbagi informasi dalam proses yang disebut "cross-attention" untuk menghasilkan output berupa gambar fotorealistik orang yang mengenakan pakaian tersebut. Kombinasi difusi berbasis gambar dan cross-attention ini menjadi model AI baru Google.

Proses training dilakukan dengan menggunakan Google's Shopping Graph

proses-training-virtual-try-on-google
Image source: Google

Untuk memaksimalkan kebermanfaatan dan realisme fitur VTO ini, dilakukan proses pelatihan yang ketat dengan menggunakan model AI baru ini. Namun, berbeda dengan Imagen yang melatih modelnya dengan menggunakan LLM, dalam pengembangan ini digunakan Google's Shopping Graph. Google's Shopping Graph adalah kumpulan data produk, penjual, merek, ulasan, dan inventaris terlengkap di dunia.

Google melatih model ini menggunakan banyak pasangan gambar, setiap pasangan terdiri dari orang yang mengenakan pakaian dalam dua pose berbeda - misalnya, gambar seseorang yang mengenakan kemeja dengan posisi berdiri menyamping dan posisi berdiri menghadap depan.

Dalam skenario ini, model AI belajar untuk mencocokkan bentuk kemeja dalam pose menyamping dengan orang dalam pose menghadap depan, dan sebaliknya, hingga akhirnya dapat menghasilkan gambar realistis dari kemeja tersebut di orang tersebut dari semua sudut pandang.

Untuk meningkatkan kualitasnya, Google terus mengulangi proses ini menggunakan jutaan pasangan gambar acak yang berbeda dari berbagai pakaian dan orang. Hasilnya memungkinkan pengguna melihat seperti apa sebuah atasan terlihat pada model pilihan.

Mulai hari ini, pengguna dapat menggunakan fitur coba pakaian virtual untuk pakaian wanita dari berbagai merek di Google's Shopping Graph, termasuk Anthropologie, LOFT, H&M, dan Everlane. Seiring berjalannya waktu, Google berharap bahwa tool ini akan menjadi semakin akurat dan diperluas untuk mencakup merek-merek favorit pengguna yang lain.

Iklan Atas Artikel

Iklan Tengah Artikel 1

Iklan Tengah Artikel 2

Iklan Bawah Artikel