Bei herkömmlichen Telefonnetzen handelt es sich um Sprachvermittlung per Leitungsvermittlung, die erforderliche Breitbandübertragung beträgt 64 kbit/s. Das sogenannte VoIP ist das IP-Paketaustauschnetzwerk als Übertragungsplattform, das die Komprimierung, Verpackung und eine Reihe spezieller Verarbeitungen von Sprachsignalen simuliert, sodass das nicht verbundene UDP-Protokoll für die Übertragung verwendet werden kann.
Zur Übertragung von Sprachsignalen in einem IP-Netzwerk sind mehrere Elemente und Funktionen erforderlich. Die einfachste Form des Netzwerks besteht aus zwei oder mehr VoIP-fähigen Geräten, die über ein IP-Netzwerk verbunden sind.
1. Sprachdatentransformation
Das Sprachsignal ist eine analoge Wellenform, die Sprache über IP überträgt, unabhängig davon, ob es sich um eine Geschäftsanwendung in Echtzeit oder um eine Geschäftsanwendung in Echtzeit handelt. Zuerst werden analoge Daten in das Sprachsignal umgewandelt, nämlich in 8 oder 6 analoge Sprachsignale quantifiziert und dann an den Pufferspeicher gesendet , kann die Größe des Puffers entsprechend den Anforderungen der Verzögerung und Codierung gewählt werden. Viele Encoder mit niedriger Bitrate werden in Frames codiert.
Die typische Rahmenlänge lag zwischen 10 und 30 ms. Unter Berücksichtigung der Übertragungskosten bestehen interlinguale Pakete normalerweise aus 60, 120 oder 240 ms Sprachdaten. Die Digitalisierung kann mithilfe verschiedener Sprachcodierungsschemata implementiert werden. Die aktuellen Sprachcodierungsstandards sind hauptsächlich ITU-T G.711. Der Sprachencoder am Quellziel muss denselben Algorithmus implementieren, damit das Sprachgerät am Ziel das analoge Sprachsignal wiederherstellen kann.
2.Originaldaten-zu-IP-Konvertierung
Sobald das Sprachsignal digital kodiert ist, besteht der nächste Schritt darin, das Sprachpaket mit einer bestimmten Rahmenlänge zu komprimieren. Die meisten Encoder haben eine bestimmte Framelänge. Wenn ein Encoder 15-ms-Frames verwendet, wird das 60-ms-Paket von Anfang an in vier Frames aufgeteilt und nacheinander codiert. Jeder Frame verfügt über 120 Sprachsamples (Abtastrate 8 kHz). Nach der Kodierung wurden die vier komprimierten Frames zu einem komprimierten Sprachpaket synthetisiert und an den Netzwerkprozessor gesendet. Der Netzwerkprozessor fügt der Stimme ein Baotou, eine Zeitskala und andere Informationen hinzu und leitet sie über das Netzwerk an den anderen Endpunkt weiter.
Das Sprachnetzwerk stellt einfach eine physische Verbindung zwischen den Kommunikationsendpunkten her (eine Leitung) und überträgt die codierten Signale zwischen den Endpunkten. Im Gegensatz zu leitungsvermittelten Netzwerken bilden IP-Netzwerke keine Verbindungen. Es erfordert, dass Daten in unterschiedlich langen Datenberichten oder Paketen platziert werden, dann Adress- und Steuerinformationen für jedes Datagramm enthalten und über das Netzwerk an das Ziel weitergeleitet werden.
3.Übertragung
In diesem Kanal wird das gesamte Netzwerk als Sprachpaket betrachtet, das vom Eingang empfangen und dann innerhalb einer bestimmten Zeit (t) an den Netzwerkausgang übertragen wird. Das t kann im gesamten Bereich variieren und spiegelt den Jitter bei der Netzwerkübertragung wider.
Derselbe Knoten im Netzwerk überprüft die mit den einzelnen IP-Daten verknüpften Adressinformationen und leitet das Datagramm mithilfe dieser Informationen an die nächste Haltestelle auf dem Zielpfad weiter. Bei einer Netzwerkverbindung kann es sich um eine beliebige Topologie oder Zugriffsmethode handeln, die IP-Datenströme unterstützt.
4. Das IP-Paket – die Transformation der Daten
Das Ziel-VoIP-Gerät empfängt diese IP-Daten und beginnt mit der Verarbeitung. Die Netzwerkebene stellt einen Puffer variabler Länge bereit, der zur Regulierung des vom Netzwerk erzeugten Jitters verwendet wird. Der Puffer kann viele Sprachpakete aufnehmen und Benutzer können die Größe des Puffers wählen. Kleine Puffer erzeugen eine geringere Latenz, regulieren jedoch keinen großen Jitter. Zweitens dekomprimiert der Decoder das codierte Sprachpaket, um ein neues Sprachpaket zu erzeugen, und dieses Modul kann auch mit Frames arbeiten, die genau die gleiche Länge wie der Decoder haben.
Wenn die Rahmenlänge 15 ms beträgt, werden die 60 ms langen Sprachpakete in 4 Rahmen aufgeteilt und dann wieder in einen 60 ms langen Sprachdatenfluss dekodiert und an den Dekodierungspuffer gesendet. Während der Verarbeitung des Datenberichts werden die Adressierungs- und Steuerinformationen entfernt, die ursprünglichen Originaldaten bleiben erhalten und diese Originaldaten werden dann dem Decoder bereitgestellt.
5. Digitale Sprache wurde in analoge Sprache umgewandelt
Das Wiedergabelaufwerk entnimmt die Sprachsamples (480) aus dem Puffer und sendet sie mit einer vorgegebenen Frequenz (z. B. 8 kHz) über den Lautsprecher an die Soundkarte. Kurz gesagt, die Übertragung von Sprachsignalen im IP-Netzwerk erfolgt durch die Umwandlung von einem analogen Signal in ein digitales Signal, die Verpackung digitaler Sprache in ein IP-Paket, die Übertragung von IP-Paketen durch das Netzwerk, das Entpacken von IP-Paketen und die Wiederherstellung digitaler Sprache in analoger Form Signal.
Zweitens VoIP-bezogene technische Standards
Für Multimedia-Anwendungen in bestehenden Kommunikationsnetzen hat die International Telecommunication Union (ITU-T) das Protokoll der H.32x-Multimedia-Kommunikationsserie entwickelt, das die folgenden Hauptstandards zur einfachen Beschreibung enthält:
H.320, Standard für Multimedia-Kommunikation auf der Schmalband-Bildtelefonanlage und Endgerät (N-ISDN);
H.321, Standard für Multimedia-Kommunikation auf dem B-ISDN;
H.322. Standard für Multimedia-Kommunikation im LAN, garantiert durch QoS;
H.323. Standard für Multimedia-Kommunikation in einem Paketvermittlungsnetz ohne QoS-Garantie;
H.324, ein Standard für Multimedia-Kommunikation auf Kommunikationsterminals mit niedriger Bitrate (PSTN und drahtlose Netzwerke).
Unter den oben genannten Standards sind H. Die durch den 323-Standard definierten Netzwerke die am weitesten verbreiteten, wie Ethernet, Token-Netzwerk, FDDI-Netzwerk usw., da H. Die Anwendung des 323-Standards natürlich zu einem Hotspot auf dem Markt geworden ist. Im Folgenden konzentrieren wir uns daher auf H.323. H.323 Im Vorschlag sind vier Hauptkomponenten definiert: Terminal, Gateway, Gateway-Verwaltungssoftware (auch als Gateway oder Gate bezeichnet) und Mehrpunkt-Steuereinheit.
1.Terminal (Terminal)
Alle Terminals müssen Sprachkommunikation unterstützen, und die Video- und Datenkommunikationsfunktionen sind optional.alle H.Das 323-Terminal muss auch den H.245-Standard unterstützen, H.245 Der Standard wird zur Steuerung der Kanalnutzung und der Kanalleistung verwendet.H .323 Die Hauptparameter des Sprachcodecs in der Sprachkommunikation sind wie folgt spezifiziert: Von der ITU empfohlene Sprachbandbreite / KHz-Übertragungsbitrate / Kb/s-Komprimierungsalgorithmus-Anmerkung G.711 3.4 56,64 Einfache PCM-Komprimierung, angewendet auf das PSTN in G .728 3,4 16 LD-CELP-Sprachqualität wie G.711, angewendet auf die Übertragung mit niedriger Bitrate G.722 7 48,56,64 ADPCM-Sprachqualität ist höher als G.711, angewendet auf Übertragung mit hoher Bitrate G .723.1G.723.0 3.4 6.35.3 LP-MLQ Sprachqualität ist akzeptabel, G.723.1 Übernehmen Sie ein G für das VOIP-Forum.729G.729A 3.4 8 CS-ACELP-Verzögerung ist niedriger als G.723.1, Sprachqualität ist höher als die G.723.1。
2.Gateway (Gateway)
Dies ist H. Eine Option für das 323-System. Das Gateway kann die Protokolle, Audio- und Videokodierungsalgorithmen und Steuersignale umwandeln, die von verschiedenen Systemen verwendet werden, um die Systemterminalkommunikation zu ermöglichen. Beispielsweise das PSTN-basierte H.324-System und Schmalband ISDN-basiertes H.Das 320-System und das H.323 Für die Systemkommunikation ist es notwendig, das Gateway zu konfigurieren;
3. Zollkontrolle (Gatekeeper)
Dies ist H. Eine optionale Komponente des 323-Systems ist die Software zur Vervollständigung der Verwaltungsfunktion. Sie hat zwei Hauptfunktionen: Die erste dient der H.323-Anwendungsverwaltung; Die zweite ist die Verwaltung der Terminalkommunikation über das Gateway (z. B. Anrufaufbau, -entfernung usw.). Manager können über den Zoll Adresskonvertierung, Bandbreitenkontrolle, Anrufauthentifizierung, Anrufaufzeichnung, Benutzerregistrierung, Kommunikationsdomänenverwaltung und andere Funktionen durchführen keep.one H.323 Die Kommunikationsdomäne kann mehrere Gateways haben, aber nur ein Gateway funktioniert.
4.Multipoint-Steuereinheit (Multipoint-Steuereinheit)
Die MCU ermöglicht die Mehrpunktkommunikation in einem IP-Netzwerk, eine Punkt-zu-Punkt-Kommunikation ist nicht erforderlich. Das gesamte System bildet durch die MCU eine Sterntopologie. Die MCU enthält zwei Hauptkomponenten: den Mehrpunkt-Controller MC und den Mehrpunkt-Prozessor MP bzw ohne MP.H zwischen MC-Verarbeitungsterminals.245 Steuerinformationen zum Aufbau eines minimalen öffentlichen Namens für die Audio- und Videoverarbeitung.MC verarbeitet keinen Medieninformationsstrom direkt, sondern überlässt ihn MP.Der MP mischt, schaltet und verarbeitet das Audio , Video- oder Dateninformationen.
In der Branche gibt es zwei parallele Architekturen, eine ist die oben vorgestellte ITU-T H.323 Das Protokoll ist das von der Internet Engineering Task Force (IETF) vorgeschlagene SIP-Protokoll (RFC2543), und das SIP-Protokoll eignet sich besser für intelligente Endgeräte.
Drittens: Der Anstoß für die VoIP-Entwicklung
Die weit verbreitete Nutzung von VoIP wird aufgrund zahlreicher Hardware-, Software- und damit verbundener Entwicklungen sowie technologischer Durchbrüche bei Protokollen und Standards schnell Realität werden. Technologische Fortschritte und Entwicklungen in diesen Bereichen spielen eine treibende Rolle bei der Schaffung eines effizienteren, funktionaleren und interoperableren VoIP-Netzwerks. Die technischen Faktoren, die die schnelle Entwicklung und sogar flächendeckende Anwendung von VoIP fördern, lassen sich in den folgenden Aspekten zusammenfassen.
1.Digitaler Signalprozessor
Fortschrittliche digitale Signalprozessoren (Digital Signal Processor, DSP) führen die rechenintensiven Komponenten aus, die für die Sprach- und Datenintegration erforderlich sind. DSP verarbeitet digitale Signale hauptsächlich, um komplexe Berechnungen durchzuführen, die andernfalls möglicherweise von einer Universal-CPU durchgeführt werden müssten. Die Kombination ihrer Spezialisierungen Durch die hohe Rechenleistung und die geringen Kosten eignet sich der DSP gut für die Signalverarbeitungsfunktionen im VoIP-System.
Einzelner Sprachstream auf dem G.729. Der Rechenaufwand für die Sprachkomprimierung ist normalerweise hoch und erfordert 20 MIPS. Wenn eine zentrale CPU erforderlich ist, um Routing- und Systemverwaltungsfunktionen auszuführen und gleichzeitig mehrere Sprachströme zu verarbeiten, ist dies unrealistisch. Daher kann die Verwendung eines oder mehrerer DSPs die Rechenaufgabe des komplexen Sprachkomprimierungsalgorithmus von der zentralen CPU deinstallieren. Darüber hinaus eignet sich DSP zur Sprachaktivitätserkennung und Echounterdrückung, sodass sie Sprachdatenströme in Echtzeit verarbeiten und schnell darauf zugreifen können On-Board-Speicher, also. In diesem Abschnitt beschreiben wir detailliert, wie Sprachcodierung und Echounterdrückung auf der TMS320C6201DSP-Plattform implementiert werden.
Protokoll und Standardsoftware und -hardware H.323 Gewichtete Fair-Queuing-Methode DSP MPLS-Tag-Austausch Gewichteter Zufall Früherkennung Erweiterter ASIC RTP, RTCP Dual Funnel General Cell Rate-Algorithmus DWDM RSVP-bewerteter Zugriff Schnelle Rate SONET Diffserv, CAR Cisco Fast Forwarding CPU-Verarbeitungsleistung G. 729, G.729a: CS-ACELP Extended Access Table ADSL, RADSL, SDSL FRF.11/FRF.12 Token-Barrel-Algorithmus Multilink PPP Frame Relay Datengleichrichter SIP basierend auf der Prioritätsintegration von CoS-Paketen über SONET IP und ATM QoS/CoS
2. Fortschrittliche dedizierte integrierte Schaltkreise
Die Entwicklung des Application-Specific Integrated Circait (ASIC) hat einen schnelleren, komplexeren und funktionaleren ASIC hervorgebracht. ASIC ist ein spezialisierter Anwendungschip, der eine einzelne Anwendung oder einen kleinen Satz von Funktionen ausführt. Da sie sich auf sehr enge Anwendungsziele konzentrieren, Sie können für bestimmte Funktionen stark optimiert werden, normalerweise mit einer Dual-Purpose-CPU, die eine oder mehrere Größenordnungen schneller ist.
So wie sich der RSIC-Chip (Thin Instruction Set Computer) auf die schnelle Ausführung von Grenzzahlen konzentriert, ist der ASIC so vorprogrammiert, dass er eine endliche Anzahl von Funktionen schneller ausführt. Sobald die Entwicklung abgeschlossen ist, sind die Kosten für die ASIC-Massenproduktion niedrig und sie wird verwendet für Netzwerkgeräte inklRouterund Switches, die Funktionen wie Routing-Tabellenprüfung, Gruppenweiterleitung, Gruppensortierung und -prüfung sowie Warteschlangen ausführen. Durch die Verwendung von ASIC erhält das Gerät eine höhere Leistung und geringere Kosten. Sie bieten eine erhöhte Breitband- und bessere QoS-Unterstützung für das Netzwerk, also spielen sie eine große Rolle bei der Förderung der VoIP-Entwicklung.
3.IP-Übertragungstechnologie
Die meisten Übertragungs-Telekommunikationsnetze verwenden Zeitmultiplex, während das Internet statistische Wiederverwendung und den Austausch langer Pakete übernehmen muss. Letzteres weist im Vergleich dazu eine hohe Auslastung der Netzwerkressourcen, eine einfache und effektive Verbindung und eine gute Anwendbarkeit auf Datendienste auf, was einer der wichtigen Gründe für die schnelle Entwicklung des Internets ist. Allerdings erfordert die breitbandige IP-Netzwerkkommunikation QoS- und Verzögerungseigenschaften Daher hat die Entwicklung des statistischen Multiplex-Paketaustauschs Bedenken hervorgerufen. Derzeit hat die World Internet Engineering Task Group (IETF) neben der neuen Generation des IP-Protokolls IPV6 auch die Multi-Protocol-Tag-Exchange-Technologie (MPLS) vorgeschlagen Es handelt sich um eine Art Netzwerkschichtauswahl, die auf dem Austausch verschiedener Tags/Tags basiert und die Flexibilität der Straßenauswahl verbessern, die Auswahlfähigkeit der Netzwerkschicht erweitern und vereinfachen kannRouterund Kanalaustauschintegration verbessern die Netzwerkleistung. MPLS kann als unabhängiges Routing-Protokoll arbeiten und mit dem vorhandenen Netzwerk-Routing-Protokoll kompatibel sein, verschiedene Betriebs-, Verwaltungs- und Wartungsfunktionen des IP-Netzwerks unterstützen und die QoS-, Routing- und Signalisierungsleistung erheblich verbessern. um das Niveau der statistischen Wiederverwendung von Festlängenpaketen (ATM) zu erreichen oder annähernd zu erreichen und einfacher, effizienter, kostengünstiger und anwendbarer als ATM zu sein.
IETF ergreift auch lokal die neue Gruppierungstechnologie, um eine QoS-Straßenauswahl zu erreichen. Die „Tunneltechnologie“ wird untersucht, um eine Breitbandübertragung von Einwegverbindungen zu erreichen. Darüber hinaus ist auch die Auswahl der IP-Netzwerkübertragungsplattform eine Frage In den letzten Jahren sind IP-over-ATM-, IP-over-SDH-, IP-over-DWDM- und andere Technologien nacheinander zu einem wichtigen Forschungsgebiet geworden.
Die IP-Schicht bietet IP-Benutzern hochwertige IP-Zugriffsdienste mit bestimmten Dienstgarantien. Die Benutzerschicht stellt die Zugriffsform (IP-Zugriff und Breitbandzugang) und die Dienstinhaltsform bereit. In der Basisschicht Ethernet als physikalische Schicht Das IP-Netzwerk ist eine Selbstverständlichkeit, aber IP overDWDM ist die neueste Technologie und hat großes Entwicklungspotenzial.
Dense Wave Division MultipLexing (DWDM) haucht Glasfasernetzen neues Leben ein und bietet Telekommunikationsunternehmen, die ein neues Glasfaser-Backbone errichten, eine erstaunliche Bandbreite. Die DWDM-Technologie nutzt die Fähigkeiten optischer Fasern und fortschrittlicher optischer Übertragungsgeräte. Der Name Wave Division Multiplexing leitet sich von der Übertragung mehrerer Daten ab Wellenlängen des Lichts (LASER) aus einem einzigen Glasfaserstrom. Aktuelle Systeme können 16 Wellenlängen senden und erkennen, während zukünftige Systeme 40 bis 96 volle Wellenlängen unterstützen können. Dies ist wichtig, da jede zusätzliche Wellenlänge einen zusätzlichen Informationsfluss hinzufügt. Das können Sie Erweitern Sie damit das 2,6-Gbit/s-Netzwerk (OC-48) um das 16-fache, ohne neue Fasern verlegen zu müssen.
Die meisten neuen Glasfasernetze laufen mit OC-192 (9,6 Gbit/s) und erzeugen in Kombination mit DWDM eine Kapazität von über 150 Gbit/s auf einem Glasfaserpaar. Darüber hinaus bietet DWDM Schnittstellenprotokoll- und geschwindigkeitsunabhängige Funktionen und unterstützt sowohl ATM , SDH- und Gigabit-Ethernet-Signalübertragung auf einer einzigen Glasfaser, die mit den bestehenden Netzwerken kompatibel sein kann, so dass DWDM bestehende Anlagen schützen kann, aber auch ISPs und Telekommunikationsunternehmen ein stärkeres Backbone bietet und Breitband kostengünstiger und zugänglicher macht starke Unterstützung für die Bandbreitenanforderungen von VoIP-Lösungen.
Die erhöhte Übertragungsrate kann nicht nur eine gröbere Pipeline mit geringerer Blockierungswahrscheinlichkeit bereitstellen, sondern auch die Verzögerung erheblich reduzieren und somit die QoS-Anforderungen in IP-Netzwerken erheblich reduzieren.
4.Breitbandzugangstechnologie
Der Benutzerzugriff auf das IP-Netzwerk ist zu einem Engpass geworden, der die Entwicklung des gesamten Netzwerks einschränkt. Langfristig ist das ultimative Ziel des Benutzerzugriffs Fiber-to-Home (FTTH). Im Großen und Ganzen umfasst das optische Zugangsnetzwerk ein optisches digitales Schleifenträgersystem und passives optisches Netzwerk. Ersteres wird hauptsächlich in den Vereinigten Staaten verwendet, kombiniert mit Open-Mouth V5.1/V5.2 und überträgt sein integriertes System über Glasfaser, was eine große Vitalität zeigt.
Letzteres ist vor allem in der Größenordnung und in Deutschland anzutreffen. Seit mehr als einem Jahrzehnt hat Japan eine Reihe von Maßnahmen ergriffen, um die Kosten für passive optische Netzwerke auf ein Niveau zu senken, das denen von Kupferkabeln und Metall-Twisted-Pair-Kabeln ähnelt, und sie insbesondere eingesetzt In den letzten Jahren hat die ITU das ATM-basierte passive optische Netzwerk (APON) vorgeschlagen, das die Vorteile von ATM und passiven optischen Netzwerken ergänzt. Die Zugriffsrate kann 622 Mbit/s erreichen, was für die Entwicklung von Breitband-IP-Multimediadiensten sehr vorteilhaft ist, die Ausfallrate und die Anzahl der Knoten reduzieren und die Abdeckung erweitern kann. Derzeit hat die ITU die Standardisierungsarbeiten abgeschlossen , Hersteller entwickeln sich aktiv weiter, es werden Waren auf den Markt kommen, die zur Hauptentwicklungsrichtung der Breitbandzugangstechnologie für das 21. Jahrhundert werden.
Derzeit sind die wichtigsten Zugangstechnologien: PSTN, IADN, ADSL, CM, DDN, X.25 und Ethernet sowie breitbandige drahtlose Zugangssystemspalten usw. Diese Zugangstechnologien haben ihre eigenen Eigenschaften, einschließlich der sich am schnellsten entwickelnden ADSL und CM; CM (Kabelmodem) verwendet Koaxialkabel, hohe Übertragungsrate, starke Entstörungsfähigkeit; aber keine bidirektionale Übertragung, kein einheitlicher Standard. ADSL (Asymmetrical Digital Loop) verfügt über exklusiven Zugang zu Breitband, nutzt das vorhandene Telefonnetz vollständig aus und bietet eine asymmetrische Übertragungsrate. Die Download-Rate auf der Benutzerseite kann 8 Mbit/s erreichen, und die Upload-Rate auf der Benutzerseite kann 1 Mbit/s erreichen. ADSL stellt Unternehmen und allen Benutzern die erforderliche Breitbandverbindung zur Verfügung und senkt die Kosten erheblich. Verwendung von kostengünstigerem ADSL Über regionale Leitungen greifen Unternehmen jetzt mit höherer Geschwindigkeit auf das Internet und internetbasierte VPN zu, was eine höhere VoIP-Anrufkapazität ermöglicht.
5.Technologie der Zentraleinheit
Zentraleinheiten (CPU) entwickeln sich in Funktion, Leistung und Geschwindigkeit ständig weiter. Dies ermöglicht eine weit verbreitete Anwendung von Multimedia-PCs und verbessert die Leistung von Systemfunktionen, die durch die CPU-Leistung begrenzt sind. Die Fähigkeit des PCs, Stream-Audio- und Videodaten zu verarbeiten, wurde lange erwartet Daher ist die Bereitstellung von Sprachanrufen über Datennetzwerke natürlich das nächste Ziel. Diese Computerfunktion ermöglicht sowohl erweiterte Multimedia-Desktopanwendungen als auch erweiterte Funktionen in Netzwerkkomponenten zur Unterstützung von Sprachanwendungen.