Speaker-Aware Camara System (SPACS): 8 Hakbang

Talaan ng mga Nilalaman:

Hakbang 1: Mga Kagamitan
Hakbang 2: Hardware - Pag-print sa 3D
Hakbang 3: Hardware - Mga Elektronikong Bahagi
Hakbang 4: Software
Hakbang 5: Software - Tunog
Hakbang 6: Software - Detalye ng Mukha at Pagsasalita
Hakbang 7: Software - Rotating Motor
Hakbang 8: Mga Pagpapabuti sa Hinaharap

👤 May -akda John Day 📧 day@howwhatproduce.com.
⏱ Public 2024-01-30 13:13.
🖍 Huling binago 2025-01-23 15:13.

Mag-isip ng isang tawag sa kumperensya kung saan maraming speaker ang pumapalibot sa isang camera. Madalas kaming nakakasalubong kung saan ang limitadong anggulo ng view ng isang camera ay madalas na nabibigo na tumingin sa taong nagsasalita. Ang limitasyon sa hardware na ito ay makabuluhang nagpapasama sa karanasan ng gumagamit. Kung ang camera ay maaaring tumingin sa mga aktibong nagsasalita, ang malayuang madla ay mas nakikibahagi sa isang pag-uusap sa panahon ng tawag. Sa proyektong ito, iminumungkahi namin ang isang (prototype) na sistema ng camera na nakakakita at sumusunod sa aktibong nagsasalita sa pamamagitan ng pag-on ng camera patungo sa nagsasalita. Gumagamit ang system ng parehong visual- at audio-based na diskarte. Kapag napansin ang mga mukha mula sa camera, tinutukoy nito ang taong nagsasalita at kinakalkula ang anggulo upang paikutin. Kapag ang mga mukha ay hindi napansin sa kasalukuyang anggulo, hinahanap ng system ang nagsasalita batay sa direksyon ng mga signal ng pagdating ng audio.

Hakbang 1: Mga Kagamitan

Adafruit Feather nRF52840 Express X 1

www.adafruit.com/product/4062

Electret Microphone Amplifier - MAX4466 X 2

www.adafruit.com/product/1063

Micro Servo Motor X 1

www.adafruit.com/product/169

Android smartphone X 1

Hakbang 2: Hardware - Pag-print sa 3D

Para sa mabilis na pagpapatupad, nagpasya kaming 3D-print ang mga enclosure na kailangan namin. Mayroong dalawang pangunahing mga bahagi para sa mga enclosure; isang paikutan at isang stand ng smartphone. Ginamit namin ang paikutan mula sa link na ito (https://www.thingiverse.com/thing:141287), kung saan nagbibigay ito ng kaso ng Arduino sa ibaba at isang umiikot na talahanayan na maaaring konektado sa isang motor na servo. Gumamit kami ng isang stand ng smartphone mula sa link na ito (https://www.thingiverse.com/thing:2673050), na kung saan ay natitiklop at naaayos na anggulo na pinapayagan kaming i-calibrate ang anggulo nang madali. Ipinapakita ng figure sa ibaba ang mga naka-print na bahagi ng 3D na pinagsama-sama.

Hakbang 3: Hardware - Mga Elektronikong Bahagi

Hardware - Mga Component na Elektronikon

Mayroong apat na mga wired na bahagi; Adafruit Feather, dalawang mikropono, at isang motor. Para sa compact na pakete, nag-solder kami (mga kulay-abo na bilog) ang mga wire nang hindi gumagamit ng isang pisara. Inilalarawan sa ibaba ang circuit diagram at ang aktwal na artifact.

Hakbang 4: Software

Pangunahing ginagamit ng aming system ang visual na impormasyon mula sa pagkilala sa mukha upang sundin ang nagsasalita dahil ito ay mas tumpak. Upang makakuha ang Feather ng visual na impormasyon mula sa Android app, ginagamit namin ang Bluetooth Low Energy bilang pangunahing paraan ng komunikasyon.

Kapag nakita ang anumang mukha, kinakalkula ng app ang anggulo na kailangang paikutin ng motor upang maituon ang speaker sa gitna ng frame. Nabulok namin ang mga posibleng sitwasyon at pinangasiwaan tulad ng sumusunod:

Kung ang (mga) mukha ay napansin at nagsasalita, kinakalkula nito ang midpoint ng mga nagsasalita at ibinabalik ang kamag-anak na anggulo sa Feather.
Kung ang (mga) mukha ay napansin at ngunit wala sa kanila ang nagsasalita, kinakalkula din nito ang midpoint ng mga mukha at ibabalik ang anggulo nang naaayon.
Kung ang anumang mukha ay hindi napansin, binabago ng system ang lohika na sumusubaybay sa speaker mula sa visual patungo sa audio.

Ang software ng SPACS ay matatagpuan sa

Hakbang 5: Software - Tunog

Tunog (YH)

Upang hanapin ang mapagkukunan ng papasok na tunog, sinubukan muna naming gamitin ang pagkakaiba ng oras sa pagitan ng dalawang mikropono. Ngunit hindi ito tumpak tulad ng inaasahan namin mula noong sampling rate (~ 900Hz) ng Arduino Leopard, kung saan sinubukan namin ang mga signal ng tunog, ay mabagal na hindi nito makukuha ang pagkakaiba sa oras sa pagitan ng 10cm-apart microphones.

Binago namin ang plano na gamitin ang pagkakaiba ng intensity sa pagitan ng dalawang input signal ng tunog. Bilang isang resulta, ang balahibo ay tumatagal ng dalawang mga signal ng tunog at iproseso ang mga ito upang makita kung saan nagmula ang tunog. Ang pagproseso ay maaaring mailarawan sa pamamagitan ng mga sumusunod na hakbang:

Kunin ang mga input mula sa dalawang mikropono at ibawas ang offset upang makuha ang mga amplitude ng mga signal.
Iipon ang ganap na mga halaga ng mga amplitude bawat MIC para sa 500 na pickup.
I-save ang pagkakaiba ng naipon na mga halaga sa pila na mayroong 5 mga puwang.
Ibalik ang kabuuan ng mga pila bilang huling halaga ng pagkakaiba.
Ihambing ang pangwakas na halaga sa mga threshold upang magpasya kung saan nagmula ang tunog.

Natagpuan namin ang threshold sa pamamagitan ng paglalagay ng huling halaga sa iba't ibang mga pangyayari kabilang ang tunog na nagmumula sa kaliwa at kanan. Sa tuktok ng mga threshold para sa pangwakas na halaga, nagtakda din kami ng isa pang threshold para sa ibig sabihin ng naipon na mga amplitude sa hakbang 2 upang ma-filter ang mga ingay.

Hakbang 6: Software - Detalye ng Mukha at Pagsasalita

Para sa pagkilala sa mukha, ginamit namin ang ML Kit para sa Firebase na inilabas ng Google (https://firebase.google.com/docs/ml-kit). Nagbibigay ang ML Kit ng API sa pagtuklas ng mukha na nagbabalik sa nagbubuklod na kahon ng bawat mukha at mga landmark nito, kabilang ang mga mata, isang ilong, tainga, pisngi, at iba't ibang mga punto sa isang bibig. Kapag nakita ang mga mukha, sinusubaybayan ng app ang paggalaw ng bibig upang matukoy kung nagsasalita ang tao. Gumagamit kami ng isang simpleng diskarte na batay sa threshold na magbubunga ng maaasahang pagganap. Pinakinabangan namin ang katotohanang ang paggalaw ng bibig ay lumalaki sa parehong pahalang at patayo kapag ang isang tao ay nagsasalita. Kinakalkula namin ang patayo at pahalang na distansya ng bibig at kinukuwenta ang karaniwang paglihis para sa bawat distansya. Ang distansya ay na-normalize sa laki ng mukha. Ang mas malaking pamantayang paglihis ay nagpapahiwatig ng pagsasalita. Ang pamamaraang ito ay may limitasyon na ang bawat aktibidad ay nagsasangkot ng paggalaw ng bibig, kasama na ang pagkain, pag-inom, o paghikab, ay makikilala bilang pagsasalita. Ngunit, mayroon itong mababang maling maling rate.

Hakbang 7: Software - Rotating Motor

Ang pag-ikot ng motor ay hindi prangka tulad ng inaasahan namin dahil sa kontrol ng bilis ng pag-ikot. Upang makontrol ang bilis, idineklara namin ang isang pandaigdigang variable ng counter tulad na nagpapahintulot sa motor na lumiko lamang kapag naabot ng variable ang isang tiyak na halaga. Nagdeklara din kami ng isa pang variable ng mundo na nagpapahiwatig kung ang motor ay gumagalaw upang ipaalam sa mga mikropono upang maiwasan nito ang tunog na nagmumula sa pag-ikot ng motor.

Hakbang 8: Mga Pagpapabuti sa Hinaharap

Ang isa sa mga limitasyon ay ang motor na nagiging wobble sa ilang mga anggulo. Tila ang motor ay hindi sapat na malakas upang mapagtagumpayan ang metalikang kuwintas na nabuo sa pamamagitan ng pag-ikot ng smartphone. Maaari itong malutas sa pamamagitan ng paggamit ng isang mas malakas na motor o pag-aayos ng posisyon ng smartphone patungo sa gitna ng pag-ikot upang mabawasan ang metalikang kuwintas.

Ang Audio na nakabatay sa pagtuklas ng direksyon ng tunog ay maaaring mapabuti sa isang mas sopistikadong pamamaraan. Nais naming subukan ang isang acoustic beamforming na diskarte upang matukoy ang direksyon ng papasok na tunog. Sinubukan namin sa oras ng pagdating ng mga audio signal. Ngunit, ang rate ng sampling ng Feather ay limitado upang makita ang pagkakaiba ng oras kapag ang mga mikropono ay nasa 10cm lamang ang layo.

Ang huling nawawalang piraso ng prototype na ito ay ang pagsusuri sa kakayahang magamit. Isang promising paraan upang suriin ang pagsasama ng system sa mayroon nang platform ng video call at pagmasdan ang mga tugon ng mga gumagamit. Ang mga tugon na iyon ay makakatulong upang mapabuti ang system at gawin ang susunod na pag-ulit ng prototype na ito.

Inirerekumendang:

Coco Speaker - Mataas na Fidelity Audio Speaker: 6 Hakbang

Coco Speaker - High Fidelity Audio Speaker: Hello Instructabler's, Siddhant dito. Nais mo bang makinig ng Mataas na kalidad ng tunog? Marahil ay gusto mong … Kaya … sa katunayan ang lahat ay gustung-gusto. Ipinakita dito ang Coco-Speaker - Alin hindi lamang nagbibigay ng kalidad ng tunog ng HD ngunit " NAKIKITA NG MATA

Paano Mag-convert ng Anumang SPEAKER Sa BLUETOOTH SPEAKER: 5 Hakbang

Paano Mag-convert ng Anumang SPEAKER Sa BLUETOOTH SPEAKER: Kung mayroon kang isang lumang home teatro system tulad ng sa akin natagpuan mo ang isang tanyag na pagpipilian ng pagkakakonekta, na tinatawag na Bluetooth, ay nawawala sa iyong system. Nang walang pasilidad na ito, kailangan mong harapin ang gulo ng kawad ng normal na koneksyon sa AUX at syempre, kung

Magdagdag ng Mga Beat Lamp sa Iyong Mga Portable Speaker o Pc Speaker : 5 Mga Hakbang

Magdagdag ng Mga Beat Lamp sa Iyong Mga Portable Speaker o Pc Speaker …: nais mo na ba ang iyong ilang maliit na portable audio speaker o pc speaker na magkapareho tulad ng kung nasa club ka ??? mahusay sa itinuturo na ito ay ipakita sa iyo kung paano mapalawak ang iyong pagsasalita sa site at tunog ng club

Mga Portable Speaker / Speaker sa Baterya: 7 Hakbang

Mga Portable Speaker / Speaker sa Baterya: Kumusta kayo. Ito ang aking unang itinuro. Tangkilikin! Kaya ngayon ako ay gong upang ipakita sa iyo kung paano gumawa mula sa mga lumang pc speaker hanggang sa mga speaker sa baterya. Medyo basic ito at marami akong mga larawan.;)

Ang Mga Speaker ng kisame ay Inilagay Sa Mga Faux Speaker Box: 6 Mga Hakbang

Ang Mga Speaker ng Ceiling Na-mount Sa Mga Faux Speaker Box: Ang ideya dito ay ang paggamit ng isang mataas na grado na nagsasalita ng kisame, na binili sa isang presyong may diskwento mula sa isang lugar ng auction, muling i-package ito para sa nakapaligid na tungkulin. Dito ginamit ko ang isang EV C8.2. Ang mga ito ay nagtitinda nang halos 350 $ isang pares. Nabili ko ang mga ito sa Ebay para sa littl

Speaker-Aware Camara System (SPACS): 8 Hakbang

Talaan ng mga Nilalaman:

Hakbang 1: Mga Kagamitan

Hakbang 2: Hardware - Pag-print sa 3D

Hakbang 3: Hardware - Mga Elektronikong Bahagi

Hakbang 4: Software

Hakbang 5: Software - Tunog

Hakbang 6: Software - Detalye ng Mukha at Pagsasalita

Hakbang 7: Software - Rotating Motor

Hakbang 8: Mga Pagpapabuti sa Hinaharap

Inirerekumendang:

Coco Speaker - Mataas na Fidelity Audio Speaker: 6 Hakbang

Paano Mag-convert ng Anumang SPEAKER Sa BLUETOOTH SPEAKER: 5 Hakbang

Magdagdag ng Mga Beat Lamp sa Iyong Mga Portable Speaker o Pc Speaker : 5 Mga Hakbang

Mga Portable Speaker / Speaker sa Baterya: 7 Hakbang

Ang Mga Speaker ng kisame ay Inilagay Sa Mga Faux Speaker Box: 6 Mga Hakbang

Lumikha ng 2D Game: 15 Hakbang

Face Mask Detector => Covid Preventer !: 5 Hakbang

Flexible Inter-Changeable Bookmark Book Light: 6 na Hakbang

Ang FitMitt: 4 na Hakbang

Advanced LED Pendant: 4 Hakbang

Pag-recycle ng Mga Bote ng Botelya Sa Elektronikong Kotse: 6 na Hakbang

UTixClock: 8 Hakbang (na may Mga Larawan)

Human-Computer Interface: Gumagawa ng isang Gripper (ginawa ni Kirigami) ng Kilusang pulso gamit ang EMG .: 7 Mga Hakbang

Petanque / Jeu-de-Boules Pagpapanatili ng Aplikasyon: 7 Mga Hakbang

Paalala sa Paghuhugas ng Kamay: 5 Mga Hakbang

Tag ng Pangalan - Micro: Bit: 8 Hakbang

Motorized String Toy para sa Mga Pusa: 6 na Hakbang

Paano Mag-redirect ng USB Modem sa isang VMware ESXi Virtual Machine: 14 Mga Hakbang

Pocket Sized Wire Loop Game: 7 Hakbang (na may Mga Larawan)

Reminichair: 9 Mga Hakbang

Pinapagana ng Arduino na Awtomatikong Walisero: 9 Mga Hakbang