Perkembangan Teknologi Audio Berbasis AI

Diposting pada

Perkembangan Teknologi Audio Berbasis AI  – Percakapan adalah kegiatan komunikasi alami manusia, antara manusia dengan manusia dan kini juga antara manusia dengan mesin ( perangkat cerdas). Bagaimana manusia berkomunikasi dengan mesin? Contoh sehari-hari yang banyak kita temui adalah aplikasi asisten pribadi berbasis suara (VPA = Voice-based Personal Assistants).

VPA tertanam di smartphone, speaker cerdas, jam tangan cerdas, earbud nirkabel, mobil, tv pintar dan remote kontrol. Bahkan telah ada tempat sampah yang mengintegrasikan pengenalan suara.

Dalam hal ini, dibutuhkan pengembangan kualitas audio yang mumpuni untuk mengenali setiap signal suara yang masuk termasuk kebisingan disekitar mikropon.

Baca Juga :  Karir di Era Industry 4.0
Perkembangan Teknologi Audio Berbasis AI
Perkembangan Teknologi Audio Berbasis AI

Bagaimana AI mengenal suara

VPA berbasis suara adalah penggerak utama industri audio saat ini. Berdasarkan pada komponen tradisional dari sistem audio seperti codec audio, mikrofon, mikroprosesor, dan amplifier audio, teknologi ini  juga menggunakan AI untuk memprediksi dan menganalisis data suara yang masuk.

Komputasi memungkinkan fungsi audio yang kompleks seperti pengenalan suara dan lokalisir sumber suara. Ini dilakukan diproses di penyimpanan cloud maupun tertanam pada perangkat pengguna. Menganalisis, yang menuntut daya pemrosesan tinggi dan akses ke banyak data, dieksekusi di cloud.

Nilai tambah AI adalah untuk pemrosesan bahasa alami, suara adalah cara yang lebih alami untuk berinteraksi dengan mesin. Anda tidak harus menggunakan keyboard. Anda tidak harus menggunakan tangan Anda. Anda hanya menggunakan suara Anda.

Untuk itu, bagaimanapun, banyak proses yang perlu dilakukan untuk memahami apa yang dibicarakan pengguna, bahasa mereka dan apa artinya. AI menambahkan nilai decoding dan membantu komunikasi manusia dengan perangkat cerdas.

Untuk pengguna, audio lebih efisien daripada gambar. Dengan input audio, pengguna masih dapat melakukan hal-hal lain artinya tidak terlalu mengganggu kegiatan lain.

Bagi perusahaan pengembang teknologi ini,  nilai aktualnya adalah mengekstraksi informasi sebanyak mungkin dari kondisi lingkungan, yang berarti bahwa VPA tidak hanya mendengarkan suara pengguna tetapi juga suara dari lingkungan pengguna untuk sekaligus memahami kondisi lingkunga.

 Misalnya, jika Anda berada di dapur, mikrofon dapat mendengar bunyi pisau dan segera memahami bahwa Anda berada di dapur dan menyarankan resep. Itu konsep komunikasi cerdas AI.

Tahap selanjutnya adalah percakapan dengan AI bisa menjadi kebiasaan, di mana telah menjadi seorang asisten virtual, misalnya berbicara dengan jam tangan pintar, berkomunikasi dengan pengguna seperti halnya manusia.

Meskipun sistem yang selalu mendengarkan ini dapat sangat membantu, ini juga meningkatkan kekhawatiran tentang perlindungan privasi pengguna. Untuk mencegah kemungkinan penyalahgunaan, solusi yang muncul adalah bahwa pemrosesan data harus dilakukan secepat mungkin dan sedekat mungkin dengan mikrofon. Semakin dekat dengan mikrofon maka semakin sedikit kemungkinan kebocoran privasi ada.

Privasi terdiri dari berbagai dimensi, karena pengguna mungkin ingin menyembunyikan jenis kelamin, usia, atau emosinya. Ke depan, melalui teknologi pula, pemrosesan mikrofon akan dapat menghilangkan emosi dari suara dan hanya membuat data audio. Tentunya merupakan tantangan terbaru bagi produsen sensor suara / mikropon.

Bagaimana solusinya? yaitu meningkatkan kecerdasan mikrofon MEMS piezoelektriknya, dengan beberapa kecerdasan buatan yang tertanam di dalam sensor. Ini akan dapat mempelajari cara manusia dan hewan menggunakan indera mereka – tidak hanya penglihatan, pendengaran, rasa, bau dan sentuhan, tetapi juga gerakan atau suhu – untuk belajar tentang lingkungan pengguna.

Mikrofon MEMS Aspek Perkembangan Teknologi Audio Berbasis AI

Pasar audio global melanjutkan pengembangannya. Karena VPA berbasis suara menuntut rasio signal-to-noise (SNR = Signal Noise Ratio) yang lebih baik untuk menangkap suara manusia secara akurat di lingkungan yang bising, peluang pasar baru akan datang untuk mikrofon MEMS. Perkembangan Teknologi Audio Berbasis AI.

Loading...
loading...
Gambar Gravatar
Saya bekerja di sebuah perusahaan Marine Service di Batam, aktivitas saya setiap hari selain melakukan kegiatan pokok di perusahaan juga menulis di blog, membangun web. Saya nge-blog sejak 2009 dan merupakan hobi sekaligus saya berbagi pengalaman.

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

This site uses Akismet to reduce spam. Learn how your comment data is processed.