суббота, 21 июля 2012 г.

Пост про перевод голоса в текст при помощи Google Voice

К блогу прикрутил интересную фишку - голосовой набор текста. Работает только в браузере Google Chrome. И называется сие чудо инженерной мысли Google Voice Search, которое было представлено широкой общественности в июне 2011 года.

голос в текст вместе с Google Voice

Чтобы ввести запрос, клавиатура стала не нужна! Чтобы выполнить поиск, достаточно нажать на значок микрофона и произнести нужные слова. Вы сможете найти все, что угодно, начиная от прогноза погоды и заканчивая расписанием кинопремьер. Даже если вы не уверены, как правильно пишется рецепт лазаньи болоньезе с сыром моцарелла, произнесите запрос, а Google сделает все остальное.

На домене Google.ru иконки с микрофоном для голосового поиска к сожалению нет у многих пользователей. Однако голосовой поиск стоит на Google.com - чтоб перейти на этот домен, находясь не в США, наберите в стоке браузера google.com/ncr и прочтите про региональный редирект еще раз

Россия пока набирает на клавиатуре

Англоязычные граждане уже диктуют
Лечится эта "региональная" несправедливость полным удалением файлов cookie. Если не помогло, то нужно добавить в браузер Chrome нужный cookie: нажимаем на любой вкладке Ctrl+Shift+J и вставляем в открывшееся окно "Console":
document.cookie="NID=53=p1CfjyF4XiMhyCxbHIwlqPaPOmUI1V9PHUrOqJuf2Aeeh2uT3fdyfBLwPT9zxg3Sq0ozBgqpD9QCCud-eddIgR-4ZLlo3jLpk9Y1jgHUsyAZwO3xsfpqgupYMTUFRY_4; expires=Wed, 12 Dec 2012 08:12:12 GMT"
Перезагружаем страницу.

Справедливость восстановлена!
На данный момент голосовой движок распознавания речи Google Voise является самым удобным, быстрым, создающим минимум ошибок и не требующим "обучения" в отличие от аналогичных продуктов.


Чтобы встроить голосовой поиск на свой сайт надо добавить в тег input, отвечающий за создание поля ввода, атрибут x-webkit-speech, являющийся результатом внедрения HTML5, например так: <input type=text x-webkit-speech />. Что касательно Blogspot, то он любит перепроверять правильность кода в шаблоне вводимого юзером. Лечится это добавлением чуть модифицированной конструкциии x-webkit-speech="x-webkit-speech" в тот же тег input
Есть примеры, когда добавляют событие onwebkitspeechchange="onChange()", которое позволяет отслеживать голосовой ввод, но это дополнительные плюшки, так сказать: <input type="text" x-webkit-speech onwebkitspeechchange="onChange()" >.
В итоге должно получиться поле ввода с изображением микрофона в правой части.

Проверьте ваш браузер: слева - поле ввода, справа - картинка как должно быть

Но, допустим, вам наоборот нужно убрать значок микрофона на какой-то странице в каком-то поле ввода, то пропишите стили (код взял здесь):

/* убираем x-webkit-speech только у одного input */
input#textfieldid::-webkit-input-speech-button {
display:none;
}

/* или у всех инпутов на странице*/
input::-webkit-input-speech-button {
display:none;
}

На основе Google Voice Search умельцами был создан скрипт, когда можно надиктовывать текст абзацами и, нажимая кнопку "Добавить",  создавать вполне читаемые заметки. Это явление носит название транскрибация.

Транскрибация (от англ. transcribe - переписывать) - это перевод ауди- видео- информации в текстовую форму.  Занятие весьма нудное и вполне прибыльное. Переводом лекций, записанных на диктофон,  для ленивых студентов занимаются многие, от фрилансера до целых фирм. Транскрибация может быть самостоятельным видом бизнеса как в оффлайн, так и в онлайн. Например, перевод аудиофайлов в текст даст дорвейщику массу уникальных текстов.

Далее, привожу код скрипта, который разместил на блоге  на отдельной странице. Если понравилось, устанавливайте у себя.

<script src="http://zamkadnyi.googlecode.com/files/russ_g_o_o.js" 
type="text/javascript">
</script>
<script src="http://zamkadnyi.googlecode.com/files/speechpad.js" 
type="text/javascript"></script>
Нажмите значок микрофона в поле ввода 
(он должен быть, если ваш браузер поддерживает голосовой ввод)!
<br /> Говорите в микрофон!
<br /> Кнопка <b>C заглавной</b> 
делает первую букву слова заглавной!
<br /> Кнопка <b>Добавить</b> 
добавляет введенный текст в результирующее поле!
<br />Кнопки <b>C заглавной</b> и кнопки пунктуации работают контекстно,
то есть по месту курсора мыши!
<br />
<div id="spinp">
<input id="speechel" cols="10" onclick="getcaretpos(this);" 
onkeyup="getcaretpos(this);" speech="speech" style="width: 80%;" 
x-webkit-speech="x-webkit-speech" />
</div>
<div>
<input id="capbtn" onclick="add_cap();" type="button" value="С заглавной" />
<input id="addbtn" onclick="add_speech();" type="button" value="Добавить" />
</div>
<table>
<tr>
<td><input class="punbtn" id="dotbtn" type="button" value=" . " 
onclick="add_punct(this)"; /></td>
<td><input class="punbtn" id="commabtn" type="button" value=" , " 
onclick="add_punct(this)"; /></td>
<td><input class="punbtn" id="semicolonbtn" type="button" value=" ; " 
onclick="add_punct(this)"; /></td>
<td><input class="punbtn" id="colonbtn" type="button" value=" : " 
onclick="add_punct(this)"; /></td>
<td><input class="punbtn" id="questionbtn" type="button" value=" ? " 
onclick="add_punct(this)"; /></td>
<td><input class="punbtn" id="exclamationbtn" type="button" value=" ! " 
onclick="add_punct(this)"; /></td>
<td><input class="punbtn" id="dashbtn" type="button" value=" - " 
onclick="add_punct(this)"; /></td>
<td><input class="punbtn" id="qoutesbtn" type="button" value="$e" 
onclick="add_punct(this)"; /></td>
<td><input class="punbtn" id="qoutesbtn" type="button" value=""" 
onclick="add_punct(this)"; /></td>
<td><input class="punbtn" id="qoutesbtn" type="button" value=" ( " 
onclick="add_punct(this)"; /></td>
<td><input class="punbtn" id="qoutesbtn" type="button" value=" ) " 
onclick="add_punct(this)"; /></td>
<td><input class="punbtn" id="qoutesbtn" type="button" value=" [ " 
onclick="add_punct(this)"; /></td>
</tr><tr>
<td><input class="punbtn" id="qoutesbtn" type="button" value=" ] " 
onclick="add_punct(this)"; /></td>
<td><input class="punbtn" id="qoutesbtn" type="button" value=" * " 
onclick="add_punct(this)"; /></td>
<td><input class="punbtn" id="qoutesbtn" type="button" value=" & " 
onclick="add_punct(this)"; /></td>
<td><input class="punbtn" id="qoutesbtn" type="button" value=" ^ "
onclick="add_punct(this)"; /></td>
<td><input class="punbtn" id="qoutesbtn" type="button" value=" % " 
onclick="add_punct(this)"; /></td>
<td><input class="punbtn" id="qoutesbtn" type="button" value="$ " 
onclick="add_punct(this)"; /></td>
<td><input class="punbtn" id="qoutesbtn" type="button" value="# " 
onclick="add_punct(this)"; /></td>
<td><input class="punbtn" id="qoutesbtn" type="button" value="@" 
onclick="add_punct(this)"; /></td>
<td><input class="punbtn" id="qoutesbtn" type="button" value="\" 
onclick="add_punct(this)"; /></td>
<td><input class="punbtn" id="qoutesbtn" type="button" value="/" 
onclick="add_punct(this)"; /></td>
<td><input class="punbtn" id="qoutesbtn" type="button" value=" | " 
onclick="add_punct(this)"; /></td>
<td><input class="punbtn" id="qoutesbtn" type="button" value=" № " 
onclick="add_punct(this)"; /></td>
<td><input class="punbtn" id="qoutesbtn" type="button" value=" ~ " 
onclick="add_punct(this)"; /></td>
<td><input class="punbtn" id="qoutesbtn" type="button" value="\n" 
onclick="add_punct(this)"; /></td>
</tr>
</table>
<textarea id="docel" cols="100" id="docel" 
onclick="getcaretpos(this)" onkeyup="getcaretpos(this);" 
rows="30" spellcheck="true" style="width: 100%;"></textarea>

Многие вебмастера еще не знают про голосовой набор и не добавляют такую возможность на свои сайты. Сделайте тогда жизнь удобной себе сами. Для Google Chrome есть специальное расширение Voice Search, которое аккуратно встраивается в панель браузера, а отводящаяся роль - добавлять голосовой ввод для всех полей ввода с тегом input

Еще можно почитать на блоге про клавиатуру сенсорную и скорость печати, а так же про полный переход на браузер Google Chrome.

3 коммент. :

Optimist комментирует...

А за что тебя билайн не взлюбил? Вчера еще у меня был доступ к твоему блогу а сегодня уже вижу вот такое сообщение: Доступ к ресурсу заблокирован. Билайн, живи на яркой стороне. Пришлось через анонимайзер.

Анонимный комментирует...

бан айпи
скорее всего траблы у когото другого на хостинге

septembritalism live комментирует...

Для распознавания речи лучше выбрать программу как RealSpeaker. Для работы на ПК понадобится любой микрофон и вэб-камера, а на большинстве ноутбуков это уже всё есть.

программа сравнивает движение губ с речью на одном из 7 доступных язвков: русский, английский (британский), американский, немецкий, французский, китайский, корейский, японский

для ОС Windows 7/8. RealSpeaker работает по принципу voice-to-text, speech-to-text

готовится выход приложения для android

Ссылки:
Репортаж "Россия24" http://www.youtube.com/watch?v=9ndyS5qSrNo

Официальный сайт: http://www.realspeaker.net

Отправить комментарий

Есть мнение, отзыв или предложение - пиши сюда!

Обязательно прочти новые посты блога