tigusigalpa/yandex-speechkit-php 问题修复 & 功能扩展

解决BUG、新增功能、兼容多环境部署,快速响应你的开发需求

邮箱:yvsm@zunyunkeji.com | QQ:316430983 | 微信:yvsm316

tigusigalpa/yandex-speechkit-php

最新稳定版本:v1.0.0

Composer 安装命令:

composer require tigusigalpa/yandex-speechkit-php

包简介

PHP SDK for Yandex SpeechKit API with Laravel support. Async speech recognition, speaker labeling, speech analysis.

README 文档

README

Yandex SpeechKit PHP SDK

PHP Version Laravel License

PHP SDK для работы с Yandex SpeechKit API. Работает как самостоятельная библиотека или как Laravel-пакет. Если вам нужно транскрибировать аудио, определять спикеров или анализировать речь из PHP — вы по адресу.

Язык: Русский | English

Что умеет

  • Асинхронное распознавание длинного аудио (до 4 часов / 1 ГБ)
  • Форматы WAV, OGG_OPUS, MP3 и raw PCM
  • Разделение по спикерам (диаризация) — кто что сказал
  • Нормализация текста и фильтрация мата из коробки
  • Мультиязычное распознавание
  • Встраивается в Laravel через Facade и Service Provider
  • Покрыт тестами

Экосистема

Пакет входит в небольшое семейство PHP-библиотек для Yandex Cloud:

Об авторизации можно не думать — yandex-cloud-client-php сам разберётся с IAM-токенами.

Требования

  • PHP ^8.0
  • Laravel ^8.0|^9.0|^10.0|^11.0|^12.0 (опционально, для интеграции с Laravel)
  • tigusigalpa/yandex-cloud-client-php ^1.0

Установка

composer require tigusigalpa/yandex-speechkit-php

Настройка Laravel

1. Опубликуйте конфиг

php artisan vendor:publish --tag=yandex-speechkit-config

Создаст файл config/yandex-speechkit.php.

2. Пропишите .env

Минимум нужен folder ID и один из способов авторизации:

# Через OAuth-токен (рекомендуется)
YANDEX_OAUTH_TOKEN=ваш_oauth_токен
YANDEX_FOLDER_ID=ваш_folder_id

# ...или через API-ключ
YANDEX_API_KEY=ваш_api_ключ
YANDEX_FOLDER_ID=ваш_folder_id

# Необязательно — дефолты подходят в большинстве случаев
YANDEX_SPEECHKIT_MODEL=general
YANDEX_SPEECHKIT_POLL_INTERVAL=10
YANDEX_SPEECHKIT_MAX_WAIT=14400

3. Service Provider

Регистрируется автоматически через package discovery Laravel — ничего делать не нужно.

Использование

Чистый PHP (без Laravel)

use Tigusigalpa\YandexCloudClient\YandexCloudClient;
use Tigusigalpa\YandexSpeechKit\YandexSpeechKitClient;
use Tigusigalpa\YandexSpeechKit\Models\RecognitionRequest;
use Tigusigalpa\YandexSpeechKit\Models\AudioFormat;

// Настройка
$cloudClient = new YandexCloudClient('ваш_oauth_токен');
$client = new YandexSpeechKitClient($cloudClient, 'ваш_folder_id');

// Собираем запрос
$request = new RecognitionRequest(
    uri: 'https://storage.yandexcloud.net/my-bucket/audio.wav',
    model: 'general',
    audioFormat: AudioFormat::container('WAV'),
);

// Самый простой способ — recognizeAndWait() сам опрашивает статус и дождётся результата
$result = $client->recognizeAndWait($request);
echo "Транскрипция: " . $result->fullText . "\n";

// Если нужен контроль, можно опрашивать вручную:
$operation = $client->recognizeFileAsync($request);
echo "ID операции: " . $operation->id . "\n";

do {
    sleep(10);
    $operation = $client->getOperation($operation->id);
    echo "Статус: " . ($operation->isDone() ? 'готово' : 'в работе') . "\n";
} while (!$operation->isDone());

$result = $client->getRecognition($operation->id);
echo "Транскрипция: " . $result->fullText . "\n";

С Laravel

use Tigusigalpa\YandexSpeechKit\Laravel\Facades\YandexSpeechKit;
use Tigusigalpa\YandexSpeechKit\Models\RecognitionRequest;
use Tigusigalpa\YandexSpeechKit\Models\AudioFormat;

$request = new RecognitionRequest(
    uri: 'https://storage.yandexcloud.net/my-bucket/audio.wav',
    audioFormat: AudioFormat::container('WAV'),
);

$result = YandexSpeechKit::recognizeAndWait($request);
echo $result->fullText;

Полный пример со всеми настройками

use Tigusigalpa\YandexSpeechKit\Models\RecognitionRequest;
use Tigusigalpa\YandexSpeechKit\Models\AudioFormat;
use Tigusigalpa\YandexSpeechKit\Models\TextNormalization;
use Tigusigalpa\YandexSpeechKit\Models\LanguageRestriction;
use Tigusigalpa\YandexSpeechKit\Models\SpeakerLabeling;

// Настраиваем всё: нормализацию, языки, разделение по спикерам
$request = new RecognitionRequest(
    uri: 'https://storage.yandexcloud.net/my-bucket/audio.wav',
    model: 'general',
    audioFormat: AudioFormat::container('WAV'),
    textNormalization: new TextNormalization(
        textNormalization: 'TEXT_NORMALIZATION_ENABLED',
        profanityFilter: true,
        literatureText: false
    ),
    languageRestriction: new LanguageRestriction(
        restrictionType: 'WHITELIST',
        languageCode: ['ru-RU', 'en-US']
    ),
    speakerLabeling: new SpeakerLabeling('SPEAKER_LABELING_ENABLED')
);

// Запускаем распознавание
$operation = $client->recognizeFileAsync($request);
echo "ID операции: " . $operation->id . "\n";

// Ждём...
do {
    sleep(10);
    $operation = $client->getOperation($operation->id);
    echo "Статус: " . ($operation->isDone() ? 'готово' : 'в работе') . "\n";
} while (!$operation->isDone());

// Что-то пошло не так?
if ($operation->hasError()) {
    throw new \RuntimeException($operation->getErrorMessage());
}

// Забираем результат
$result = $client->getRecognition($operation->id);
echo "Транскрипция: " . $result->fullText . "\n";
echo "Слов: " . count($result->words) . "\n";

// Можно пройтись по отдельным словам с таймкодами
foreach ($result->words as $word) {
    echo sprintf(
        "%s [%s - %s]\n",
        $word['text'],
        $word['startTimeMs'],
        $word['endTimeMs']
    );
}

// Не забудьте почистить за собой
$client->deleteRecognition($operation->id);
echo "Результаты удалены.\n";

Передача аудио в base64

Нет удалённого URL? Можно передать содержимое файла напрямую:

$audioContent = base64_encode(file_get_contents('/path/to/audio.wav'));

$request = new RecognitionRequest(
    content: $audioContent,
    audioFormat: AudioFormat::container('WAV')
);

$result = $client->recognizeAndWait($request);

Работа с raw PCM

use Tigusigalpa\YandexSpeechKit\Models\AudioFormat;

$request = new RecognitionRequest(
    uri: 'https://storage.yandexcloud.net/my-bucket/audio.pcm',
    audioFormat: AudioFormat::raw(
        audioEncoding: 'LINEAR16_PCM',
        sampleRateHertz: 16000,
        audioChannelCount: 1
    )
);

Отмена операции

Передумали? Не проблема:

$operation = $client->recognizeFileAsync($request);

$cancelledOperation = $client->cancelOperation($operation->id);
echo "Операция отменена: " . $cancelledOperation->id . "\n";

Справочник API

Методы клиента

Метод Что делает Возвращает
recognizeFileAsync($request) Запускает асинхронное распознавание Operation
getRecognition($operationId) Забирает результат распознавания RecognitionResult
deleteRecognition($operationId) Удаляет сохранённые результаты bool
getOperation($operationId) Проверяет статус операции Operation
cancelOperation($operationId) Отменяет операцию Operation
recognizeAndWait($request, $poll = 10, $maxWait = 14400) Всё в одном: отправить, дождаться, вернуть результат RecognitionResult
getCloudClient() Возвращает базовый cloud-клиент YandexCloudClient

Поддерживаемые форматы

Формат Тип Как использовать
WAV Контейнер AudioFormat::container('WAV')
OGG_OPUS Контейнер AudioFormat::container('OGG_OPUS')
MP3 Контейнер AudioFormat::container('MP3')
LINEAR16_PCM Raw AudioFormat::raw('LINEAR16_PCM', 16000, 1)

Модели распознавания

  • general — основная, подходит для большинства задач
  • general:rc — release candidate, новее, но менее обкатана
  • general:deprecated — старая версия, пока доступна
  • deferred-general — то же качество, но обрабатывается в очереди (дешевле)
  • deferred-general:rc — отложенная RC
  • deferred-general:deprecated — отложенная, старая версия

Обработка ошибок

Три типа исключений, чтобы можно было реагировать по ситуации:

use Tigusigalpa\YandexSpeechKit\Exceptions\AuthenticationException;
use Tigusigalpa\YandexSpeechKit\Exceptions\RecognitionException;
use Tigusigalpa\YandexSpeechKit\Exceptions\OperationException;

try {
    $result = $client->recognizeAndWait($request);
} catch (AuthenticationException $e) {
    // Плохой токен, истёкшие credentials и т.п.
    echo "Ошибка авторизации: " . $e->getMessage();
} catch (RecognitionException $e) {
    // Что-то не так с аудио или запросом
    echo "Ошибка распознавания: " . $e->getMessage();
    echo "Код ошибки API: " . $e->getApiErrorCode();
} catch (OperationException $e) {
    // Таймаут, отменённая операция и т.д.
    echo "Ошибка операции: " . $e->getMessage();
}

Тесты

composer install
vendor/bin/phpunit

Ссылки

Лицензия

MIT. См. LICENSE.

Автор

Игорь СазоновGitHub · sovletig@gmail.com

Участие в разработке

PR и issues приветствуются. См. CONTRIBUTING.md.

统计信息

  • 总下载量: 7
  • 月度下载量: 0
  • 日度下载量: 0
  • 收藏数: 5
  • 点击次数: 5
  • 依赖项目数: 0
  • 推荐数: 0

GitHub 信息

  • Stars: 5
  • Watchers: 1
  • Forks: 0
  • 开发语言: PHP

其他信息

  • 授权协议: MIT
  • 更新时间: 2026-03-05

承接程序开发

PHP开发

VUE

Vue开发

前端开发

小程序开发

公众号开发

系统定制

数据库设计

云部署

网站建设

安全加固