Soniox

Overview

SonioxSTTService provides real-time speech-to-text transcription using Soniox’s WebSocket API with support for over 60 languages, custom context, multiple languages in the same conversation, and advanced features for accurate multilingual transcription. By default, Soniox uses the stt-rt-v4 model with vad_force_turn_endpoint=True, which disables Soniox’s native turn detection and relies on Pipecat’s local VAD to finalize transcripts. This configuration significantly reduces the time to final segment (~250ms median). Pipecat enables smart-turn detection by default using LocalSmartTurnAnalyzerV3. To use Soniox’s native turn detection instead, set vad_force_turn_endpoint=False.

Soniox STT API Reference

Pipecat’s API methods for Soniox STT integration

Example Implementation

Complete example with interruption handling

Soniox Documentation

Official Soniox documentation and features

Soniox Console

Access multilingual models and API keys

Installation

To use Soniox services, install the required dependencies:

pip install "pipecat-ai[soniox]"

Prerequisites

Soniox Account Setup

Before using Soniox STT services, you need:

Soniox Account: Sign up at Soniox Console
API Key: Generate an API key from your console dashboard
Language Selection: Choose from 60+ supported languages and models

Required Environment Variables

SONIOX_API_KEY: Your Soniox API key for authentication

API Reference

Services

Utilities

Frameworks

Pipeline

Overview

Soniox STT API Reference

Example Implementation

Soniox Documentation

Soniox Console

Installation

Prerequisites

Soniox Account Setup

Required Environment Variables

API Reference

Services

Utilities

Frameworks

Pipeline

​Overview

Soniox STT API Reference

Example Implementation

Soniox Documentation

Soniox Console

​Installation

​Prerequisites

​Soniox Account Setup

​Required Environment Variables

Overview

Installation

Prerequisites

Soniox Account Setup

Required Environment Variables