Sunday, 9 May 2021
More

    Latest Posts


    Youtube hadirkan fitur AI Noise Cancellation untuk Storiesnya di iOS

    Youtube baru saja menambah fitur Noise Cancellation dengan teknologi AI untuk para Youtube Creator. Namun, fitur ini baru tersedia untuk perangkat iOS.

    Beberapa tahun yang lalu, perusahaan teknologi ini meluncurkan sebuah teknologi AI yang disebut Looking to Listen. Melalui teknologi ini, Youtube menghadirkan Noise Cancellation yang dapat menyamarkan suara yang kamu dengarkan di tengah orang banyak.

    Kali ini, mereka menambahkannya pada fitur Stories Youtube bagi para creator yang menggunakan perangkat iOS. Melalui fitur Looking to Listen ini, Google mengajarkan korelasi antara ucapan dan sinyal visual seperti gerakan mulut dan ekspresi wajah pembicara dengan melatihnya pada banyak koleksi video online.

    Untuk memasitkan bahwa fitur ini akan bekerja untuk semua orang dan tidak akan menunjukkan bias, Google melakukan serangkaian tes yang mengeksplorasi kinerjanya berdasarkan berbagai atribut visual dan auditori. Atribut tersebut meliputi usia pembicara, warna kulit, bahasa lisan, nada suara, visibilitas wajah, gerakan kepala, kumis atau janggut, keberadaan kacamata dan tingkat kebisingan dari latar belakang.

    Misalnya, mereka dapat menentukan bahwa kemampuan teknologi untuk menyempurnakan ucapan tetap cukup konsisten di seluruh bahasa. Sementara, janggut atau kumis tampaknya juga tidak berpengaruh besar, meski paling baik digunakan pada wajah yang telah dicukur.

    Youtube juga menjelaskan dalam posting pengumumannya seputar bagaimana mereka telah meningkatkan teknologi selama beberapa tahun terakhir. Pertama, para developer memasitkan bahwa ia dapat melakukan semua pemrosesan di perangkat itu sendiri, sehingga tidak perlu mengirim apapun ke server jarak jauh.

    Mereka juga menggunakan teknik yang memungkinkan fitur mengekstrak gambar mini dengan wajah dari video untuk dianalisis dengan sangat cepat. Fitur ini memungkinkan teknologi untuk memulai peningkatan ucapan mereka saat video masih direkam.

    Peningkatan tersebut memperkecil ukuran fitur dari 120MB menjadi 6MB, membuatnya lebih mudah untuk diterapkan. Google mengatakan bahwa mereka juga “mengurangi running time [Looking to Listen] dari 10x real0tme di dekstop menggunakan formulasi asli menjadi 0,5x kinerja real-time yang hanya menggunakan CPU iPhone.”

    Faktanya, teknologi ini hanya membutuhkan beberapa detik untuk memproses Stories yang berdurasi 15 detik. Untuk mengaktifkan fitur tersebut, kreator hanya perlu mengaktifkan “Enchance Speech” pada volume controls dalam perangkat iOS.

     

    Baca juga, Google Maps Hadirkan fitur Live View AR

    LEAVE A REPLY

    Please enter your comment!
    Please enter your name here

    Latest Posts

    POPULAR