Das ursprüngliche Funktionsprinzip beruht auf der Zerlegung eines Eingangssignals in seine Frequenzbestandteile, der Übertragung dieser Bestandteile als Parametersatz, sowie der darauf folgenden Resynthese des Signals am Ziel auf der Basis der Parameter aus einem Rauschsignal. Somit verfügt ein Vocoder über eine Aufnahmeeinheit (Coder) zur Klanganalyse und einen Wiedergabeteil (Voder) zur Klangsynthese. Das Arbeitsprinzip basiert auf der Funktionsweise des menschlichen Sprachorgans.
Bei der Anwendung als Effektgerät wird das Ausgangssignal nicht aus Rauschen synthetisiert, sondern ein zweites Eingangssignal wird der spektralen Zusammensetzung des ersten Signals entsprechend moduliert. Es werden also zwei Eingangssignale verarbeitet, die vom Vocoder miteinander verknüpft werden. Dem Schwingen der Stimmbänder beim menschlichen Sprachorgan entspricht das zweite Eingangssignal, es liefert das Grundsignal, aus dem das Ausgangssignal erzeugt wird. Der Artikulation durch Zunge und Lippe entspricht das erste Eingangssignal, es dient als Steuersignal für das Klangspektrum und die Modulation, wobei das Spektrum des ersten Signals auf das zweite formend wirkt. Mit einem Sprachsignal als Steuersignal und einem zu modulierenden Instrumentensignal ist es etwa möglich, ein Instrument „sprechen“ zu lassen.
Im Vocoder wird zunächst die Grundfrequenz des Eingangssignals herausgelöst und als Träger genutzt. Das Klangspektrum wird mit Hilfe einer Bandpass-Filterbank in einzelne Frequenzbänder aufgeteilt. In den einzelnen Bändern wird durch Gleichrichtung der jeweilige Amplitudenverlauf in eine entsprechende Spannung umgewandelt. Die Spannungen aller einzelnen Bänder stellen zusammen den oben angesprochenen Parametersatz dar. Die Genauigkeit der Klanganalyse hängt von der Anzahl der verwendeten Filter sowie deren Einsatzfrequenz ab.
Bei der Synthese steuert das Trägersignal einen Oszillator, der die Grundschwingung erzeugt, während mit Hilfe einer zweiten Filterbank, gesteuert durch die von den Envelope Followers hervorgebrachten Spannungskonturen, das analysierte Klangspektrum auf der Basis von weißem Rauschen neu aufgebaut wird.
Vocoder in der Musikpraxis sind jedoch mit zwei Eingängen für unterschiedliche Signale ausgestattet, die jeweils dem beschriebenen Prozess unterzogen werden. Die Verschaltung der beiden Eingangssignale ist eine Matrix, deren Steuersignale auch vertauscht oder gleichgeschaltet werden können.
Man kann damit beispielsweise die Stimme eines Sängers durch einen Orgel- oder Streicherklang so ersetzen, dass ein mehrstimmig eingespielter Satz den Gesangstext artikuliert. Durch Kombination verschiedener Eingangssignale und technischen Manipulationen sind vielfältige Soundmöglichkeiten mit der menschlichen Stimme (z. B. Roboter- oder Micky-Maus-Stimmen), aber auch verschiedene Instrumentaleffekte erreichbar.
Der Klang eines Vocoders ähnelt gelegentlich dem eines Harmonizers, und wird mit ihm verwechselt. Entgegen einer weit verbreiteten Meinung ist der sogenannte „Cher-Effekt“ (erstmals zu hören auf Chers Believe) nicht mit einem Vocoder, sondern mit Hilfe der Software Auto-Tune von Antares bzw. des entsprechenden Hardware-Gerätes des gleichen Herstellers entstanden. Auto-Tune wird normalerweise zur Tonhöhen-Korrektur von schlecht intoniertem Gesang verwendet. Die Produzenten des Stückes leugneten zunächst die Verwendung, wohl um Cher nicht mit schlecht intoniertem Gesang in Verbindung zu bringen.
Auf Regelmöglichkeiten verzichte ich hier, das sie je nach Hersteller zu verschieden sind