Het traditionele telefoonnetwerk verzendt spraak via circuituitwisseling en de vereiste transmissiebreedband is 64 k bit/s. De zogenaamde VoIP is gebaseerd op een IP-pakketschakelingsnetwerk als transmissieplatform. Het analoge spraaksignaal wordt gecomprimeerd, verpakt en een reeks speciale verwerkingen ondergaan, zodat het het verbindingsloze UDP-protocol voor transmissie kan gebruiken.
Er zijn verschillende elementen en functies nodig om spraaksignalen op een IP-netwerk te verzenden. De eenvoudigste vorm van het netwerk bestaat uit twee of meer apparaten met VoIP-mogelijkheden die via een IP-netwerk met elkaar zijn verbonden.
1. Voice-naar-data coversie
Spraaksignaal is een analoge golfvorm, via de IP-manier om stem te verzenden, of het nu een real-time toepassing is of een niet-real-time toepassing. Ten eerste moet het spraaksignaal worden omgezet in analoge gegevens, dat wil zeggen dat het analoge spraaksignaal moet worden geconverteerd worden gekwantiseerd met 8 of 6 bits en vervolgens naar het bufferopslaggebied worden verzonden, de grootte van de buffer kan worden geselecteerd op basis vanaan de vertragings- en coderingsvereisten. Veel encoders met een lage bitsnelheid zijn gebaseerd op framecodering.
Typische framelengtes variëren van 10 tot 30 ms. Rekening houdend met de kosten tijdens de verzending, bestaat het interspeech-pakket gewoonlijk uit 60, 120 of 240 ms aan spraakgegevens. Digitalisering is mogelijkdoor verschillende spraakcoderingsschema's te gebruiken, waarvan de belangrijkste ITU-T G.711 is. De stemcodeerder op de bronbestemming moet hetzelfde algoritme implementeren, zodat het spraakapparaat op de bestemming het analoge spraaksignaal kan herstellen.
2, de originele gegevens voor thij IP-conversie
Zodra het spraaktekenal digitaal gecodeerd is, is de volgende stap het comprimeren en coderen van het spraakpakket met een specifieke framelengte. De meeste encoders hebben een specifieke framelengte. Als een encoder een frame van 15 ms gebruikt, wordt het 60 ms-pakket van het eerste in vier frames verdeeld en op volgorde gecodeerd. Elk frame heeft 120 spraakmonsters (bemonsteringssnelheid 8 kHz). Na het coderen worden de vier gecomprimeerde frames gesynthetiseerd tot een gecomprimeerd spraakpakket en naar de netwerkprocessor gestuurd. De netwerkprocessor voegt pakketheaders, tijdstempels en andere informatie toe aan de stem en verzendt deze via het netwerk naar het andere eindpunt.
Het spraaknetwerk brengt eenvoudigweg fysieke verbindingen (een lijn) tot stand tussen het communicatie-eindpunts en verzendt de gecodeerde signalen tussen de eindpunten. In tegenstelling tot circuitgeschakelde netwerken vormen IP-netwerken geen verbindingen; in plaats daarvan vereisen ze dat gegevens in datagrammen of pakketten van variabele lengte worden geplaatst, die vervolgens elk via het netwerk worden verzonden met adresserings- en besturingsinformatie en van station naar station naar de bestemming worden doorgestuurd
3. Overdracht
In dit kanaal wordt gezien dat het hele netwerk een spraakpakket ontvangt van de ingang en dit vervolgens binnen een bepaalde tijd (t) aflevert aan de netwerkuitgang. Deze kan binnen een volledig bereik variëren, wat jitter in de netwerktransmissie weerspiegelt.
Collega's in het netwerk onderzoeken de adresinformatie die aan elk IP-pakket is gekoppeld en gebruiken deze informatie om het datagram door te sturen naar het volgende station op het pad naar zijn bestemming. Een nettowerkkoppeling kan elke topologie of toegangsmethode zijn die IP-gegevensstromen ondersteunt.
4、 IP-pakket- dateen conversie
Het doel-VoIP-apparaat ontvangt deze IP-gegevens en begint met de verwerking. Het netwerkniveau biedt een buffer met variabele lengte die wordt gebruikt om de door het netwerk gegenereerde jitter te reguleren. De buffer kanis geschikt voor veel spraakpakketten en gebruikers kunnen de grootte van de buffer kiezen. Kleine buffers produceren kleinere vertragingen, maar kunnen geen grote jitter reguleren. Ten tweede drukt de decoder het gecodeerde spraakpakket uit om een nieuw spraakpakket te produceren. Deze module kan ook per frame worden bediend, deze heeft precies dezelfde lengte als de decoder.
Als de framelengte 15 ms is, worden de spraakpakketten van 60 ms verdeeld in 4 frames en vervolgens gedecodeerd tot een spraakgegevensstroom van 60 ms en naar de decoderingsbuffer gestuurd. Tijdens de proNa het beëindigen van het datagram wordt de adresserings- en besturingsinformatie verwijderd en blijven de originele onbewerkte gegevens behouden, die vervolgens aan de decoder worden verstrekt.
5. Digitale spraakconversienaar analoge stem
De afspeeldriver haalt de spraakbemonsteringspunten (480) uit de buffer en stuurt deze naar de geluidskaart, en zendt ze uit via de luidspreker op een vooraf bepaalde frequentie (bijvoorbeeld 8 kHz). In een notendop gaat de transmissie van spraaksignalen via IP-netwerken via de conversie van analoge signalen naar digitale signalen, de encapsulde omzetting van digitale spraak in IP-pakketten, de transmissie van IP-pakketten via het netwerk, het uitpakken van IP-pakketten en het herstel van digitale spraak naar analoge signalen.
VOIP is een van onze activiteiten waartoe behoortONUserie netwerkproducten, en de relevante hot-netwerkproducten van ons bedrijf omvatten verschillende soortenONUserieproducten, inclusief ACONU/ communicatieONU/ intelligentONU/ doosONU/ dubbele PON-poortenONU, enz. Het bovenstaandeONUserieproducten kunnen worden gebruikt voor de netwerkvereisten van verschillende scenario's. Welkom bij een meer gedetailleerd technisch inzicht in de producten.