Audio Transcription

Transcreve arquivos de áudio para texto usando Whisper local ou API. Use quando o usuário solicitar transcrição de áudios, mensagens de voz, ou converter fal...

installs

stars

karma

SkillRank score ↗

4.3/ 10

evaluated by implexa, claude-haiku-4-5 · 2026-07-12

audio-transcription converts audio files to text via whisper (local or api), supporting multiple formats with automatic language detection, but lacks explicit error handling and decision logic.

structure

3.0

trigger phrases

5.0

procedure

4.0

edge cases

2.0

documentation

4.0

strengths

SKILL.md

---
name: audio-transcription
description: Transcreve arquivos de áudio para texto usando Whisper local ou API. Use quando o usuário solicitar transcrição de áudios, mensagens de voz, ou converter fala em texto. Suporta formatos OGG, MP3, WAV, M4A e outros via conversão automática.
---

# Audio Transcription

Transcreve arquivos de áudio para texto.

## Recursos

- Transcrição de áudios em português e outros idiomas
- Suporte a múltiplos formatos (OGG, MP3, WAV, M4A, etc.)
- Conversão automática de formatos se necessário
- Detecção automática de idioma

## Como Usar

### Pré-requisitos

A skill tenta usar as seguintes ferramentas na ordem:
1. `whisper` (OpenAI Whisper via pip)
2. `whisper.cpp` se instalado em `~/whisper.cpp`
3. API OpenAI (requer OPENAI_API_KEY)

### Script de Transcrição

Use o script `scripts/transcribe.sh`:

```bash
scripts/transcribe.sh <arquivo_audio> [idioma]
```

Exemplo:
```bash
scripts/transcribe.sh /path/to/audio.ogg pt
```

### Parâmetros

- `arquivo_audio`: Caminho para o arquivo de áudio
- `idioma` (opcional): Código do idioma (pt, en, es, etc.). Padrão: auto-detect

## Instalação de Dependências

Se nenhuma ferramenta estiver disponível, a skill pode instalar whisper:

```bash
pip install openai-whisper
```

Para whisper.cpp local:
```bash
git clone https://github.com/ggerganov/whisper.cpp.git ~/whisper.cpp
cd ~/whisper.cpp
make
```

## NOTAS

- O formato OGG (Opus) do Telegram requer ffmpeg para conversão
- A transcrição pode levar alguns segundos dependendo do tamanho do áudio
- Qualidade da transcrição depende do modelo Whisper usado

don't have the plugin yet? install it then click "run inline in claude" again.

Audio Transcription

SKILL.md

related skills