---
title: "Echovo: Neue iPhone-App bringt KI-Sprachsynthese komplett offline aufs Handy"
date: 2026-02-11
author: "Kevin Kyburz"
featured_image: "https://techgarage.blog/wp-content/uploads/2026/02/Echovo-Qwen3-TTS.avif"
categories:
  - name: "News"
    url: "/news.md"
---

# Echovo: Neue iPhone-App bringt KI-Sprachsynthese komplett offline aufs Handy

Wer schon immer Texte in gesprochene Sprache umwandeln oder gar Stimmen klonen wollte, brauchte bisher teure Cloud-Dienste wie ElevenLabs oder OpenAI. Die neue iPhone-App **Echovo** ändert das: Sie bringt leistungsstarke KI-Sprachsynthese komplett aufs Smartphone – kostenlos, offline und ohne Abo.

## Qwen3-TTS: Das Modell hinter Echovo

Echovo setzt auf **[Qwen3-TTS](https://huggingface.co/Qwen/Qwen3-TTS-12Hz-1.7B-Base)**, ein Open-Source-Sprachmodell aus dem Januar 2026. Das Besondere: Während konkurrierende TTS-Modelle auf Cloud-Server angewiesen sind, wurde Qwen3-TTS speziell für die lokale Ausführung auf Endgeräten optimiert. Trainiert wurde es mit fünf Millionen Stunden Sprachdaten – eine beeindruckende Datenbasis.

## Das kann die App

Nach der Installation stehen zwei Modelle zum Download bereit – jeweils rund 1,9 GB gross. Das Base-Modell reicht für einfache Text-to-Speech-Umwandlung und Voice-Cloning. Mit dem CustomVoice-Modell lassen sich zusätzlich verschiedene Stimmen auswählen. Insgesamt werden elf Sprachen unterstützt, darunter Deutsch und Englisch.

Für das **Voice-Cloning** genügt bereits ein drei Sekunden langer Audio-Clip. Die KI analysiert die Stimme und kann anschliessend beliebige Texte in dieser Stimme vorlesen. Mit starken Akzenten und Dialekten tut sich das Modell noch schwer – Sprachmelodie und Eigenheiten trifft es aber erstaunlich gut.

## Performance und Anforderungen

Die Sprachausgabe erfolgt je nach Gerät teils schneller als Echtzeit. Auf einem [iPhone](https://techgarage.blog/iphone-air-auseinandergebaut-so-schafft-apple-nur-56-mm/) der neuesten Generation erreichte ein geklonter Clip einen Real-Time-Factor von über 4 – die Generierung war also viermal schneller als die Länge des fertigen Audios. Die App zeigt dabei Echtzeit-Metriken wie RAM-Verbrauch und Chip-Temperatur an.

Für die beste Performance empfehlen die Entwickler ein Gerät mit **A17 Pro oder neuer**. Zusätzlich sollte genügend Speicherplatz für die Modelle eingeplant werden.

## Fazit

Echovo zeigt eindrucksvoll, wie weit die On-Device-KI bereits ist. Ohne Cloud-Anbindung, ohne laufende Kosten, ohne Datenschutz-Bedenken. Wer mit Text-to-Speech experimentieren will, findet hier einen kostenlosen Einstieg – und wer schon immer mal seine eigene Stimme klonen wollte, bekommt das Werkzeug dafür frei Haus.

**[Echovo](https://apps.apple.com/app/echovo/id6740043373)** ist ab sofort kostenlos im App Store verfügbar.