Anton
@Neighbour

Всем привет. Сейчас мы переживаем небывалый хайп AI, айтишные компании увольняют сотрудников и заменяют их AI-ем. OpenAI уже не знает, куда девать сотни миллиардов, в нее закачанные. Цукерберг переманивает AI-специалистов за сотни миллионов. При этом когда я общаюсь на греческом с ChatGPT, то общается он со мной неохотно, разговор не поддерживает, команду "помедленнее" не выполняет ) Вопрос к вам: посоветуйте плз хорошее AI-app, который бы поддерживал беседу, где можно было бы настроить уровень и скорость. Наверняка уже сделали такое.

2025-11-15 17:07:07

Igor Akimov
@akimovpro

Такого нет, к сожалению. Если брать llm-ки с голосом, то есть тот же chatgpt, Gemini, grok, там просто нет настроек скорости говорения. Для этой задачи надо брать отдельно голос в текст, генерацию текста, текст в голос, а это слишком муторно делать чисто для греческого, тем более качество на нем среднее. Хотя... Можно попробовать что-нибудь собрать

2025-11-16 07:01:28

Andrey Shipilov
@Andrey_Shipilov

Во всех платных версиях всех публичных моделей есть функции настройки среды. В том же самом чате жипити создаёте отдельную жипитишку, заливаете туда словарный запас, за рамки которого она не должна выходить, перечень грамматики, за рамки которого она не должна выходить, и - вперёд!

2025-11-15 17:55:27

Igor Akimov
@akimovpro

Но скорость речи все равно не регулируется.

2025-11-15 17:58:34

Andrey Shipilov
@Andrey_Shipilov

В диалоге в режиме реального времени это пока неосуществимо по архитектурным причинам. Регулировать скорость (в пределах +- 20%) без ухудшения качества пока можно только при озвучке написанных текстов. Можно заранее записать за диск устойчивые выражения, отдельные слова или даже фонемы и из них на лету собирать диалог (как это и делают сервисы обучения), но это будет большой и не дешевый проект.

2025-11-15 20:23:46

Igor Akimov
@akimovpro

Ну вот сейчас попробовал parakeet, на 40% замедленная речь генерируется примерно с такой же задержкой. Предыдущего поколения сетки могут довольно вольно обращаться со звуком, но качество конечно будет не топовое. И да, это примерно 15 евро за час речи, лучше уже преподавателя найти :)

2025-11-15 19:23:50

Alexey Anischenko
@Alexey_Anischenko

Хммм, а зачем для этого нейросеть? Vimu player, куча других плееров и аудиоредакторов без проблем замедляют-ускоряют речь даже 2 раза... Youtube так тоже умеет. Не тупо увеличивая частоту семплирования (чип&дейл), или уменьшая (Дарт Вейдер), а по нормальному, т.е. тембр тот же остается.

2025-11-15 19:33:41

Igor Akimov
@akimovpro

Нейросеть обучается в том числе на медленной речи, качество получается выше.
Вот с Language Transfer я тоже пытался стандартными звуковыми алгоритмами качество улучшить, получалось ужасно. А нейросетки справились норм - https://t.me/cylang/44595

2025-12-06 08:24:31

Andrey Shipilov
@Andrey_Shipilov

Ну вы же спрашивали не о "генерации речи", а о ведении диалога с ИИ на греческом языке в режиме реального времени. Или я вас неверно понял?

2025-11-16 07:04:48

Andrey Portnyagin
@91632384

сообщение удалено

2025-11-18 20:03:45