Skip to main content

Wat is een akoestisch model?

Een akoestisch model is in wezen een kaart van de stem in relatie tot een reeks gedrukte woorden.Deze technologie wordt gebruikt in spraakherkenningsprogramma's om een computer te helpen leren spraakpatronen van een persoon te herkennen.Een akoestisch model is een van de twee belangrijkste bestanden die nodig zijn om een spraakherkenningsprogramma uit te voeren;De andere is het taalmodel, dat waarschijnlijk woorden en spraakpatronen aangeeft die door de spreker kunnen worden gebruikt.Deze modellen worden gemaakt door de geluidsdetails van een gesproken audiobestand te vergelijken met de tekst van de gesproken woorden.

Speechherkenningssoftware is software die is ontworpen om de woorden te herkennen en te transcriberen of te reageren die een persoon zegt.Veel besturingssystemen zijn ontworpen met ingebouwde fundamentele spraakherkenningsmogelijkheden die de gebruiker kan in- en uitschakelen.Spraakherkenningsmogelijkheden op besturingssystemen geven de gebruiker meestal de mogelijkheid om de computer te besturen en woorden op het scherm te typen met behulp van haar stem.

Om toegang te krijgen tot spraakherkenningssoftware, heeft een gebruiker een microfoon nodig om haar stem naar de computer te krijgen, plus een programmaDat verwerkt het geluid.Hoewel veel computers ingebouwde microfoons hebben, stelt een externe headset-microfoon de gebruiker het voordeel van duidelijker spraakgeluid en de vrijheid om zich te verplaatsen door de kamer tijdens het spreken.Software -merken van zelfstandige spraakherkenning zijn Lumenvox , Loquendo , en Dragon .

De meeste spraakherkenningsprogramma's hebben akoestisch modelprogrammering waarmee het programma variaties in de uitspraak kan herkennen.Ze gebruiken patronen in het geluid van de stem van de luidsprekers om woorden in spraak te identificeren.Velen zijn ontworpen met setup -software gemaakt om de gebruiker te helpen een akoestisch model te maken dat is ontworpen om haar eigen stem te interpreteren.Sommige geavanceerde programma's voor spraakherkenning kunnen meerdere talen identificeren en interpreteren, vaak met een kleine hoeveelheid geluidsinformatie.Hoe geavanceerder een spraakherkenningsprogramma, hoe groter de kans dat het woorden nauwkeurig interpreteren op basis van zijn context, inclusief waar in een zin een woord wordt gesproken.

Het vakgebied dat spraakherkenningstechnologie ontwikkelt, wordt computationele taalkunde genoemd.Computationele taalkunde omvat studie en ontwerp dat software creëert die is geprogrammeerd om menselijke spraak te begrijpen.Dit veld bevat vaak informatie uit de studie van psychologie om akoestische modellen te creëren die spraak nauwkeuriger kunnen interpreteren.

Het woord akoestisch verwijst in het algemeen naar alles wat met geluid te maken heeft.Hoewel akoestische modellen meestal worden gebruikt bij spraakherkenning, kunnen ze ook in muziek worden gebruikt.Een akoestisch model van een muzieknummer kan eigenschappen zoals beats per minuut, de muzikale sleutels of dominante velden in de muziek identificeren.Deze informatie kan door een computerprogramma worden gebruikt om een muziektrack te identificeren, of het kan worden gebruikt om het genre losjes te bepalen waarin de muziek waarschijnlijk wordt gecategoriseerd.Akoestische modellen worden ook gebruikt in een vakgebied genaamd psychoacoustics, waarin onderzoekers hopen muziek te leren structureren die voorspelbaar de hersenen beïnvloedt.