Mundarija:

Google AIY Voice Kit -ga Trigger Start Sound -ni qo'shing: 6 qadam (rasmlar bilan)
Google AIY Voice Kit -ga Trigger Start Sound -ni qo'shing: 6 qadam (rasmlar bilan)

Video: Google AIY Voice Kit -ga Trigger Start Sound -ni qo'shing: 6 qadam (rasmlar bilan)

Video: Google AIY Voice Kit -ga Trigger Start Sound -ni qo'shing: 6 qadam (rasmlar bilan)
Video: Hacking the Google AIY Voice Kit - Part 1 2024, Iyul
Anonim
Image
Image
2 -qadam: Qo'shimcha ma'lumot olish uchun Voicehat.py faylini tekshiring
2 -qadam: Qo'shimcha ma'lumot olish uchun Voicehat.py faylini tekshiring

Bu darslik juda oddiy. Menga Google AIY Voice Kit -dan juda yoqdi, lekin men odatdagidek Google Home -dagi kabi, ular faol tinglayotganlarini tasdiqlash uchun shovqin qilishadi. Bu AIY Voice Kit tasviriga oldindan yuklangan misollarning hech birida sukut bo'yicha o'rnatilmagan.

Men, shuningdek, Zoom yozuvchisi bilan haqiqiy Google Home -dan yozib olgan shovqinlarni tasdiqlash va tasdiqlash havolasini qo'shaman.

Mana, men birinchi ko'rsatma beraman!

1 -qadam: kerakli materiallar va fayllar

  1. To'liq ishlaydigan Google AIY Voice Kit-to'plamingizni sozlash uchun rasmiy AIY Voice Kit sahifasiga tashrif buyuring.
  2. Pi terminaliga SSH, VNC yoki monitor va klaviatura orqali kirish imkoniyati
  3. Pi ovozli kirishni tinglayotganda o'ynatmoqchi bo'lgan. Wav fayli-Agar maxsus fayl ishlatilmasa, standart "St art Talking" faylini bu erdan yuklab oling yoki uni havola qilingan havoladan yuklab oling.
  4. (Ixtiyoriy) Fayllarni o'zgartirishi, bit va namuna tezligini o'zgartirishi mumkin bo'lgan audio muharriri

2 -qadam: 2 -qadam: Qo'shimcha ma'lumot olish uchun Voicehat.py faylini tekshiring

MUHIM

Men ovozli to'plamimda Ovoz va Vizyon to'plami (ya'ni aiyprojects-2018-01-03.img) kodini o'z ichiga olgan so'nggi rasmni ishlatmayapman. Men Google AIY Raspbian GitHub -da joylashgan Voice Kit filialining kodini ishlataman. Mening shaxsiy fikrim - bu ovozli to'plam bilan ishlashda Vision kodi bilan shug'ullanishning hojati yo'q

Davom etmoq…

Bu qadam mutlaqo majburiy emas, lekin agar siz bu qadamni oldinga siljitmoqchi bo'lsangiz yoki nima uchun men qo'shayotgan kodni tushunmoqchi bo'lsangiz, Google bu ishni bajarish bo'yicha ko'rsatmalarni qaerga ko'mib qo'yganini ko'rsatadi.

pi@malina: cd AIY-ovozli to'plam-python/src/aiy/

Keyin biz ushbu papkadagi voicehat.py faylini tekshiramiz:

pi@malina: ~/AIY-voice-kit-python/src/aiy/sudo nano voicehat.py

Qo'shilgan rasmda Status UI -lari va tetik paytida ovozdan qanday foydalanish haqida bilib olishingiz mumkin.

Yaxshi, endi bu ishni bajarish uchun misol fayllaridan biriga kod qo'shamiz.

3 -qadam: 3 -qadam: Trigger tovush kodini demo kodiga qo'shing

3 -qadam: Trigger tovush kodini demo kodiga qo'shing
3 -qadam: Trigger tovush kodini demo kodiga qo'shing

Birinchidan, AIY-voice-kit-python papkasiga o'ting va manba kodini ishga tushiring

CD AIY-ovozli to'plam-python

manba env/bin/activate

CD src

Keyin "sudo nano" ni "assistant_grpc_demo.py" yoki "assistant_library_demo.py" ga ishlating.

Ikki faylning farqi shundaki, assistant_grpc_demo.py Google Assistant -ni ishga tushirish uchun tugmani ishlatadi va assistant_library_demo.py Google Assistant -ni ishga tushirish uchun "Ok, Google" faollashtirish so'zidan foydalanadi.

Ushbu ikkala fayl uchun siz faqat bitta kod qatorini qo'shishingiz kerak:

status_ui.set_trigger_sound_wave ('/home/pi/googlestart.wav')

Bu sizning boshlang'ich ovozingizni/home/pi/papkasida joylashtirganingizni va googlestart.wav deb nomlanganingizni anglatadi. Faylni nima deb nomlaganingizga va qaerda joylashtirganingizga qarab, ularni o'zgartiring.

Biz izlayotgan kod qatori quyida:

status_ui.status ("tinglash")

Biz kod satridan oldin yangi kod qatorimizni qo'shmoqchimiz …

"Assistant_library_demo.py" misoli uchun uni bu erda topish mumkin:

elif event.type == EventType. ON_CONVERSATION_TURN_STARTED:

# Va endi status_ui.set_trigger_sound_wave ('home/pi/googlestart.wav') status_ui.status ('tinglash') kodimizni qo'shing

"Assistant_grpc_demo.py" misoli uchun uni bu erda topish mumkin:

button.wait_for_press ()

# Va endi status_ui.set_trigger_sound_wave ('/home/pi/googlestart.wav') status_ui.status ("tinglash") kodini qo'shing

Bu sizning boshlang'ich ovozingizni/home/pi/papkasida joylashtirganingizni va googlestart.wav deb nomlanganingizni anglatadi. Faylni qanday nomlagan bo'lsangiz va qayerda bo'lsangiz ham, ularni o'zgartiring.

Hammasini saqlash uchun CTRL-X & Y tugmalarini bosing.

*** DIQQAT: Men biroz ahmoqona narsani topdim. "Assistant_library_demo.py" uchun tetik tovushini qo'shish nutqni aniqlash funktsiyasida hech qanday farq qilmaydi. "Assistant_grpc_demo.py" uchun, agar siz tetik ovozini ishlatganingizda, u siz aytgan birinchi yoki ikkita so'zni kesib tashlaydi. Nima uchun to'liq aniq emas. Hali ham buni tushunishga harakat qilmoqda.

4 -qadam: 4 -qadam: Kodni ishga tushiring va hamma narsa yaxshi ekanligiga ishonch hosil qiling

pi@malina: cd AIY-ovozli to'plam-python

va virtualenv -ni yuklang

pi@malina: ~/AIY-voice-kit-python $ source env/bin/activate

va ishga tushiring!

(env) pi@malina: ~/AIY-ovozli to'plam-python $ src/assistant_library_demo.py

yoki

(env) pi@malina: ~/AIY-ovozli to'plam-python $ src/assistant_grpc_demo.py

Endi "OK, Google" deb ayting yoki tugmani bosing va u ishlayotganini ko'ring!

Keyingi sahifa sizning shaxsiy faylingiz va.wav faylingiz uchun mos bit va namuna tezligi bo'lsa sizga yordam beradi

5 -qadam: 5 -qadam: O'zingizning.wav faylingizni yarating

5 -qadam: O'zingizning.wav faylingizni yarating
5 -qadam: O'zingizning.wav faylingizni yarating

Agar siz.wav faylimdan Google Home standart ovozini ishlatishni xohlamasangiz, o'zingiz.wav faylini yaratishingiz kerak bo'ladi. Men uchun to'g'ri bit va namuna tezligini olish uchun biroz sinov va xato kerak bo'ldi.

Men Logic Pro X-dan musiqani yaratish va ishlab chiqarish uchun to'la-to'kis DAW bo'lgan barcha tahrirlarni (rasmda) bajarish uchun ishlatardim. Men mos keladigan ikkita variant - Switch yoki MediaHuman Audio Converter. Menimcha, agar sizda Mac bo'lsa, buni Garageband bilan qilishingiz mumkin, lekin men buni sinab ko'rmaganman.

Demo kod bilan ishlash uchun sizning faylingizning uchta asosiy qismi kerak.

  1. MONO audio fayli bo'lishi kerak
  2. Namuna olish tezligi 32000 bo'lishi kerak
  3. . Wav fayli bo'lishi kerak
  4. (Ixtiyoriy) 16 bitli o'lchamlari men uchun eng yaxshi ishladi

6 -qadam: 6 -qadam: Tasdiq ovozi qo'shilsinmi?

Agar kimdir qandaydir fikrga ega bo'lsa, men shu erda qolib ketaman. Agar tizim oddiy Google Home -dagi kabi ovozli kirishni tan olsa, men tasdiqlash shovqinini qo'shishni istardim.

Sizga qulay bo'lishi uchun men quyida aksiya tasdiqlash shovqinini biriktirdim.

Xursand bo'ling!

Tavsiya: