Mengenal DALL-E 2, Artificial Intelligence yang Ciptakan Gambar dari Kata-Kata
04 January 2023 |
21:58 WIB
2
Likes
Like
Likes
Pernah memimpikan kalau membuat lukisan itu gampang? Tinggal ketik deskripsi gambar seperti apa yang diinginkan pada kolom pencarian, lalu klik kolom Generate. Tunggu beberapa saat, dan empat buah gambar persegi bakal muncul berdasarkan prompt yang kalian inginkan.
Seperti yang penulis lakukan beberapa jam lalu dengan menulis ”a photograph of girl and rain”, lalu tak sampai semenit muncul empat lukisan foto yang dihasilkan mesin ini. Meski dua di antaranya cenderung tidak simetris, hasil yang muncul bisa dibilang lumayan untuk awam yang ‘buta seni’.
Generator seni AI semacam ini memang banyak menyita perhatian publik belakangan, baik karena kemajuannya yang luar biasa hingga kegunaannya yang dipertanyakan. Dall-E dari OpenAI adalah salah satu nama utama yang diperbincangkan di sosial media, khususnya Twitter. Apalagi ketika ada hasil AI yang memenangkan lomba, seperti karya dari Jason Allen yang dibuat menggunakan program Midjourney.
Nah, saat ini kalian bisa menggunakan kata-kata emosional untuk mendapat hasil maksimal dari “foto” atau "lukisan" atau “ilustrasi” yang dihasilkan kecerdasan buatan (artificial intelligence/AI) dengan kemungkinan yang tidak terbatas. Satu-satunya batasan yang dimiliki adalah 400 karakter untuk mendiskripsikan keinginan.
Baca juga: Hype Report, Tantangan Seniman & Desainer pada Era AI, Akankah Posisi Mereka Tergantikan?
Sebelum bicara lebih jauh soal program artifisial Dall-E, mari kita cari tahu dulu apa itu OpenAI. OpenAI adalah perusahaan riset nirlaba yang bertujuan untuk mengembangkan dan mengarahkan artificial intellegence dengan cara yang bermanfaat bagi umat manusia.
Perusahaan ini didirikan oleh Elon Musk – meskipun pada 2018 dia keluar dari OpenAI - dan Sam Altman pada 2015. Tentu saja Musk tak perlu diperkenalkan lagi, sementara Altman adalah seorang entrepreneur, investor, programer, dan mantan presiden Y Combinator.
Berkantor pusat di San Francisco, California, OpenAI dibuat karena kekhawatiran eksistensial pendirinya tentang potensi malapetaka akibat penyalahgunaan AI. OpenAI yang terus mendapat sumbangan dana dari berbagai pihak, terutama dana sebesar US$1 miliar yang diberikan Microsoft, kemudian mengubah diri menjadi capped for profit, dengan keuntungan maksimal hingga 100x dari investasi yang dilakukan pada 2019 itu.
Ada berbagai produk AI yang dibuat oleh OpenAI, seperti ChatGPT yang akhirnya dibuka ke publik setelah pertama diumumkan pada 2020 dengan nama GPT-3. Ada juga program OpenAI Five, Gym, RoboSumo, Debate Game, Dactyl, GPT, Music, dan DALL-E, artificial intelligence yang mampu menghasilkan gambar realistis dari perintah deskripsi berbentuk teks dari pengguna.
Diumumkan pada Januari 2021, nama Dall-E diambil dari nama pelukis surealisme terkenal di dunia, Salvador Dali dan robot dalam kartun animasi bernama Wall-E. Dikutip dari MIT, OpenAI melakukan lompatan besar dengan menciptakan DALL-E, salah satu alat AI terbaik yang dapat menghasilkan karya-karya menakjubkan. Mereka bahkan meluncurkan DALL-E 2 yang menyediakan gambar dengan resolusi dan presisi empat kali lebih besar.
Perusahaan menyatakan bahwa misi mereka adalah untuk memastikan bahwa kecerdasan buatan bermanfaat bagi seluruh umat manusia. Untuk mencegah penyalahgunaan gambar yang dihasilkan oleh program AI, mereka melakukan kontrol rancangan agar pengguna tidak semena-mena memakai kemampuan DALL-E 2.
Sesuai dengan ide awalnya, tidak akan ada konten seksual atau kekerasan atau upaya untuk membuat gambar publik figur. OpenAI memiliki keseluruhan sistem untuk membantu moderator mendeteksi masalah secara otomatis. Salah satu kekurangannya adalah tidak bisa membuat gambar orang sungguhan.
Baca juga: Hype Report: Berbagi Ruang antara AI, Arsitek, dan Desainer Interior
Seperti yang penulis lakukan di atas, DALL-E 2 menerima input berupa teks – seperti kelinci yang membawa buku – program kemudian “membuat” gambar realitas berdasarkan perintah tersebut. Tak hanya itu, DALL-E 2 juga secara otomatis menghasilkan gambar baru atau kombinasi terbaru yang belum ada.
Namun, bila berbicara masalah teknis tentunya akan lebih rumit. Teknologi kecerdasan buatan saat ini umumnya mengacu pada sistem yang dilatih untuk mengenali pola dalam data di dunia yang jumlahnya sangat besar.
DALL-E 2 menggunakan teknologi yang dinamakan diffusion modeling (pemodelan difusi). Model difusi ini melakukan dua proses berurutan, bagaimana sistem membongkar gambar, lalu mencoba membangunnya kembali. Dalam urutan pembongkaran, setiap langkah mengubah gambar yang diberikan, menambah bentuk-bentuk lain, lalu meneruskannya ke langkah berikutnya. Proses ini dilakukan berulang kali yang akhirnya menyebabkan gambar asli berangsur-angsur memudar menjadi status dan maknanya menghilang.
Saat proses ini selesai, model menjalankannya secara terbalik. Dimulai dengan menghilangkan sedikit noise, kemudian mengembalikan gambar melalui serangkaian langkah, yang akhirnya mengurangi noise dan mengembalikan makna foto awal. Bisa dibilang mengaburkan gambar adalah proses mekanis, sedangkan mengembalikannya kembali adalah pencarian makna.
Kalian juga bisa pertimbangkan analogi lain. DALL-E 2 ibarat seorang pelukis yang menjalani seluruh hidupnya di ruangan abu-abu tanpa jendela. Pengguna menunjukkan kepadanya jutaan lukisan lanskap dengan berbagai konsep. Kemudian, memberinya cat dengan label warna dan memintanya untuk mencocokkan warna dan membuat pola yang secara statistik meniru label subjek.
Dia membuat jutaan lukisan acak, membandingkan masing-masing dengan lanskap nyata, dan kemudian mengubah tekniknya hingga mulai terlihat realistis.
Dall-E 2 tidak sepenuhnya gratis. Layanan berjalan dengan sistem "kredit". Para pengguna awal mendapatkan 50 kredit gratis saat mendaftar, dan kemudian 15 kredit gratis per bulan setelah itu, tetapi tidak diperpanjang. Kredit berbayar dari bulan ke bulan, hingga 12 bulan. Kalian bisa mendapatkan 115 kredit dengan harga $15 atau sekitar Rp230.000.
Dalam blognya, DALL-E 2 mengatakan lebih dari 1,5 juta pengguna aktif membuat lebih dari 2 juta gambar per hari dengan generator ini, mulai dari seniman, penulis, arsitek, dan pekerja kreatif lainnya. Saat ini, Microsoft sedang mengintegrasikan sistem DALL-E 2 ke dalam beberapa aplikasi terbaru: Designer dan Image Creator.
Apakah kalian menganggapnya menakjubkan atau mengerikan, tampaknya kita baru saja memasuki zaman di mana komputer dapat menghasilkan lukisan dan artikel yang meyakinkan.
Sungguh aneh bahwa gambar yang bermakna bagi seseorang dapat dihasilkan dari operasi matematika dalam komputer. Meski begitu, layaknya film-film robot yang kita tonton, hal itu memang canggih. Akan tetapi bisakah mereka menghasilkan karya yang membangkitkan emosi? Atau hanya sebuah gambar cantik yang enak dipandang mata?
Baca juga: Hype Report, Menengok Potensi Teknologi AI di Industri Perfilman
(Baca artikel Hypeabis.id lainnya di Google News)
Editor: Syaiful Millah
Seperti yang penulis lakukan beberapa jam lalu dengan menulis ”a photograph of girl and rain”, lalu tak sampai semenit muncul empat lukisan foto yang dihasilkan mesin ini. Meski dua di antaranya cenderung tidak simetris, hasil yang muncul bisa dibilang lumayan untuk awam yang ‘buta seni’.
Generator seni AI semacam ini memang banyak menyita perhatian publik belakangan, baik karena kemajuannya yang luar biasa hingga kegunaannya yang dipertanyakan. Dall-E dari OpenAI adalah salah satu nama utama yang diperbincangkan di sosial media, khususnya Twitter. Apalagi ketika ada hasil AI yang memenangkan lomba, seperti karya dari Jason Allen yang dibuat menggunakan program Midjourney.
Nah, saat ini kalian bisa menggunakan kata-kata emosional untuk mendapat hasil maksimal dari “foto” atau "lukisan" atau “ilustrasi” yang dihasilkan kecerdasan buatan (artificial intelligence/AI) dengan kemungkinan yang tidak terbatas. Satu-satunya batasan yang dimiliki adalah 400 karakter untuk mendiskripsikan keinginan.
Baca juga: Hype Report, Tantangan Seniman & Desainer pada Era AI, Akankah Posisi Mereka Tergantikan?
Siapa di Balik Dall-E?
(Sumber gambar: hasil Dall-E by OpenAI
Perusahaan ini didirikan oleh Elon Musk – meskipun pada 2018 dia keluar dari OpenAI - dan Sam Altman pada 2015. Tentu saja Musk tak perlu diperkenalkan lagi, sementara Altman adalah seorang entrepreneur, investor, programer, dan mantan presiden Y Combinator.
Berkantor pusat di San Francisco, California, OpenAI dibuat karena kekhawatiran eksistensial pendirinya tentang potensi malapetaka akibat penyalahgunaan AI. OpenAI yang terus mendapat sumbangan dana dari berbagai pihak, terutama dana sebesar US$1 miliar yang diberikan Microsoft, kemudian mengubah diri menjadi capped for profit, dengan keuntungan maksimal hingga 100x dari investasi yang dilakukan pada 2019 itu.
Ada berbagai produk AI yang dibuat oleh OpenAI, seperti ChatGPT yang akhirnya dibuka ke publik setelah pertama diumumkan pada 2020 dengan nama GPT-3. Ada juga program OpenAI Five, Gym, RoboSumo, Debate Game, Dactyl, GPT, Music, dan DALL-E, artificial intelligence yang mampu menghasilkan gambar realistis dari perintah deskripsi berbentuk teks dari pengguna.
Diumumkan pada Januari 2021, nama Dall-E diambil dari nama pelukis surealisme terkenal di dunia, Salvador Dali dan robot dalam kartun animasi bernama Wall-E. Dikutip dari MIT, OpenAI melakukan lompatan besar dengan menciptakan DALL-E, salah satu alat AI terbaik yang dapat menghasilkan karya-karya menakjubkan. Mereka bahkan meluncurkan DALL-E 2 yang menyediakan gambar dengan resolusi dan presisi empat kali lebih besar.
Perusahaan menyatakan bahwa misi mereka adalah untuk memastikan bahwa kecerdasan buatan bermanfaat bagi seluruh umat manusia. Untuk mencegah penyalahgunaan gambar yang dihasilkan oleh program AI, mereka melakukan kontrol rancangan agar pengguna tidak semena-mena memakai kemampuan DALL-E 2.
Sesuai dengan ide awalnya, tidak akan ada konten seksual atau kekerasan atau upaya untuk membuat gambar publik figur. OpenAI memiliki keseluruhan sistem untuk membantu moderator mendeteksi masalah secara otomatis. Salah satu kekurangannya adalah tidak bisa membuat gambar orang sungguhan.
Baca juga: Hype Report: Berbagi Ruang antara AI, Arsitek, dan Desainer Interior
Cara Kerja DALL-E 2
Seperti yang penulis lakukan di atas, DALL-E 2 menerima input berupa teks – seperti kelinci yang membawa buku – program kemudian “membuat” gambar realitas berdasarkan perintah tersebut. Tak hanya itu, DALL-E 2 juga secara otomatis menghasilkan gambar baru atau kombinasi terbaru yang belum ada.Namun, bila berbicara masalah teknis tentunya akan lebih rumit. Teknologi kecerdasan buatan saat ini umumnya mengacu pada sistem yang dilatih untuk mengenali pola dalam data di dunia yang jumlahnya sangat besar.
DALL-E 2 menggunakan teknologi yang dinamakan diffusion modeling (pemodelan difusi). Model difusi ini melakukan dua proses berurutan, bagaimana sistem membongkar gambar, lalu mencoba membangunnya kembali. Dalam urutan pembongkaran, setiap langkah mengubah gambar yang diberikan, menambah bentuk-bentuk lain, lalu meneruskannya ke langkah berikutnya. Proses ini dilakukan berulang kali yang akhirnya menyebabkan gambar asli berangsur-angsur memudar menjadi status dan maknanya menghilang.
Saat proses ini selesai, model menjalankannya secara terbalik. Dimulai dengan menghilangkan sedikit noise, kemudian mengembalikan gambar melalui serangkaian langkah, yang akhirnya mengurangi noise dan mengembalikan makna foto awal. Bisa dibilang mengaburkan gambar adalah proses mekanis, sedangkan mengembalikannya kembali adalah pencarian makna.
Kalian juga bisa pertimbangkan analogi lain. DALL-E 2 ibarat seorang pelukis yang menjalani seluruh hidupnya di ruangan abu-abu tanpa jendela. Pengguna menunjukkan kepadanya jutaan lukisan lanskap dengan berbagai konsep. Kemudian, memberinya cat dengan label warna dan memintanya untuk mencocokkan warna dan membuat pola yang secara statistik meniru label subjek.
Dia membuat jutaan lukisan acak, membandingkan masing-masing dengan lanskap nyata, dan kemudian mengubah tekniknya hingga mulai terlihat realistis.
Dall-E 2 tidak sepenuhnya gratis. Layanan berjalan dengan sistem "kredit". Para pengguna awal mendapatkan 50 kredit gratis saat mendaftar, dan kemudian 15 kredit gratis per bulan setelah itu, tetapi tidak diperpanjang. Kredit berbayar dari bulan ke bulan, hingga 12 bulan. Kalian bisa mendapatkan 115 kredit dengan harga $15 atau sekitar Rp230.000.
Dalam blognya, DALL-E 2 mengatakan lebih dari 1,5 juta pengguna aktif membuat lebih dari 2 juta gambar per hari dengan generator ini, mulai dari seniman, penulis, arsitek, dan pekerja kreatif lainnya. Saat ini, Microsoft sedang mengintegrasikan sistem DALL-E 2 ke dalam beberapa aplikasi terbaru: Designer dan Image Creator.
Apakah kalian menganggapnya menakjubkan atau mengerikan, tampaknya kita baru saja memasuki zaman di mana komputer dapat menghasilkan lukisan dan artikel yang meyakinkan.
Sungguh aneh bahwa gambar yang bermakna bagi seseorang dapat dihasilkan dari operasi matematika dalam komputer. Meski begitu, layaknya film-film robot yang kita tonton, hal itu memang canggih. Akan tetapi bisakah mereka menghasilkan karya yang membangkitkan emosi? Atau hanya sebuah gambar cantik yang enak dipandang mata?
Baca juga: Hype Report, Menengok Potensi Teknologi AI di Industri Perfilman
(Baca artikel Hypeabis.id lainnya di Google News)
Editor: Syaiful Millah
Komentar
Silahkan Login terlebih dahulu untuk meninggalkan komentar.