UbIvItS, Вообще-то Идне абсолютно прав все современный так называемые ИИ это решение оптимизационной задачи. Те поиск максимума функции. Что касается просадки по качеству у Гугля, то это сделано специально. Так как раньше на платных каналах качество было огого. А сейчас на бесплатных бэээ. Мэнеджеры придержали проект, и технологию утратили. И это было до изобретения TPU. Что касается 8 бит то за счёт глубинного обучения вытянут. Абсолютно не поэтому. А потому что полный набор данных неизвестен либо превышает мыслимые размеры. Поэтому и ставится задача уметь предсказывать на неизвестных данных. Проблема в том что делать это мы не умеем. А вот сместить акцент в сторону увеличения качества расспознования в выбранном датасете легко. Да сетка получается перобученной, но это как раз в большинтсве случаев и нужно. Как следствие на неизвестных данных имеем рэндом. Причем это принципиально не решается. Но найти баланс в виде 1 ошибка на 1000 запросов для конкретного датасета просто.
тут я с Вами малёхо не соглашусь == чтобы говорить об оптимизации функции, нужны чёткие критерии оценки получаемого результата. если задачу описывать в виде системы лог уравнений, то (конечно) можно говорить об оптимизации функции по ключевым показателям, но такие функи даже при самой глубокой оптимизации роняют любой суперкомп полный набор данных по-любому не нужен и пример с попугаем показателен == алго хотя бы должен обозначить наличие речи в записи. мыслимые размеры, кстати, превышает не датасет, а метаданные. именно поэтому в большинстве случаев используются не системы лог уравнений, где потолок метаданных не имеет обозримых краёв, а схемы «угадай мелодию на кофейной гуще». в том-то и дело, что при гаданиях на кофейной гуще, как раз-таки и берут максимально фаворный датасет с жёстким отсевом всего прочего. к примеру, лишь сравнительно недавно хухль стал делать потуги для распознавания речи в музыке. вот, кстати, неплохой пример.. https://youtu .be/MreIXQQhHmg?t=1101 в эмоциональной речи идёт растяжение/обрыв звуков, тч угадайка отлично падает впрочем, и от языка зависит.. на аглицком успехи действительно неплохие.. 1. используются более дорогие модели. 2. сам аглицкий более удобен для такой автоматики == слова довольно короткие и состоят из достаточно ярко выраженных звуков. ==== любопытны также примеры с речью/песнями на заднем фоне == идёт распознавание голоса на переднем плане.. ЗЫ.. правда, не стоит забывать и другой момент == много аглицких песен и поп передач были отлично транскрибированны до всяких тамо ии и НИКТО не мешает использовать такой датасет для самопроверок нс-ок. ЧТО В ОПРЕДЕЛЁННОЙ МЕРЕ МОЖЕТ НЕЗАМЕТНО ПЕРЕХОДИТЬ В РАЗРЯД ЧИТЪЪЪ
UbIvItS, Задача распознавания звуков довольно проста, так звук одномерен. Тоесть это лишь сигнал развёрнутый во времени, в отличие от изображений. Можно всякие применить фильтры и уже по базе найти ближайшее подобие, наверно оно так и распознаётся. А есчо нужно учитывать что произношение сильно изменяется и тут как раз поможет какой то фонетический разбор и прочее такое, что связывает отдельные слова. А вот с изображением такое не прокатит.
UbIvItS, гугл распознаёт английский язык лучше только потому что у них датасет в 10 раз больше, чем для других языков. Единственное что удобно в английском это отсутствие склонений по подежам. Если в русском вам нужно распознавать буквенные n-граммы, то в аглийском можно распознавать слова целиком. По сути у них язык содержит избыточное кодирование из которого можно восстановить недостающие буквы. Никаких чётких звуков в английском нету. И вообще это от языка не зависит. В этом как раз основная проблема старые учёные насчитали кто 47 кто 54 а кто 57 звуков в русском языке против 33 букв. Но на деле их там больше гораздо больше. (14*13)*7*7=8918 чётких звуков, а вот нечётких и не счесть, но не более чем 2^84. Но даже база в 350 тб звуков хватает для распознавания всего на свете. Для английского достаточно найти паузы и ударные звуки применить между ними временное сжатие и поиск в этой большой базе известного решения. По словарю часто встречающихся слов разделить слитную речь на слова. Для русского из-за изменчивости его слов такое не прокатит. Любим мы склонять слова, так что так просто с хорошем качеством не получится. Вот для определенной отрасли частной задачи можно процент поднять где набор слов типовой. Прокатит. Есть база 1000 предметов и 1 миллион фотографий этих предметов. После появления глубинного обучения то бишь когда базу научились засовывать в нейронную сеть качество распознавание составило 85%, а после за 10 лет вышли на 97%. 85% это 1 ошибка на 6 изображений, 97% это 1 на 32 изображения. Рост производительности компьютеров 1٫25 в год. Или что должно соответствовать 6*9=56 Или что должно соответствовать 98% качеству распознавания. Этого хватает для начала практического применения. За это время датасеты подросли до 3000 предметов. Сейчас наверно и 10 000. Основных предметов порядка 40-100 тысяч. Плюс то что раньше на супер компьютерах запускалась сейчас перешло на персональные компьютеры и микрокомпьютеры. И чем больше датасет тем больше там шумов которые мешают правильному обучению. И вообще распознавать изображения уже не модно. Сейчас модно распознавать движения сел человек встали или навел на вас пушку.
да-вот, ладно == куча слов с очень чёткими звуками.. bar, tar, car, tree, back, stack, mark, star.. Вы тут абсолютно правы. и тут абсолютно правы. распознавание контекста/действий требует уЖО решения систем лог уравнений. тут-ки цЫфФрька крашится в свой физ предел.
UbIvItS, > распознавание контекста/действий требует уЖО решения систем лог уравнений. Зачем ? Благодаря памяти движение отображается статически в виде трека. В чём же проблема наложить обьект на картинку с выборкой по времени, а затем прогнать через нс как обычное изображение. Задача упрощается так как есть направления при движении.
Nafanya, а вы тот самый человек, что на старом васме рассказывали про С++ ? Типа что все неправильно пишут на нем, надо в институте учится и все такое. Так а уже оно так и есть. Считайте, вин7 больше не поддерживается, вин8 давно уже в прошлом. Осталась 8.1 (которая скоро тоже уйдет в небытие, т.к. фиг знает где стоит), и десятка (и соответствующий ей сервер 2019). А на десятке у нас что - на десятке у нас стоит виндеф, который в облаке не может обойти 99% малваре кодеров. А аверы пусть делают что хотят, Майкрософт их уберет вместе с малварой, да и все. Конечно, щас Каспер и прочие кукарекают за "монополию", но кто бы их слушал..
Некоторые люди до сих пор полуосью пользуются. Текущая версия ArcaOS (основанная на OS/2 Warp 4.52) за июль 2019. Один чел с неё музычку гоняет в Hi-End колоночки. ArcaOS (OS/2) - путь к аудионирване
Matan, бук судя по всему какая-то вариация ThinkPad'а (ну очень дикое старье судя по отсутствию тачпада). Аудиошланг вставлен в то место, где у финкпадов аналоговый аудиовыход (встроенная звуковуха, очень понтово). Этот бук недостаточно ретро, чтобы быть ламповой ЭВМ (ну знаешь все эти ламповоусилительные фетиши), почему владелец решил, что воспроизводить с него звук круто? И главное при чем тут ОС, звук воспроизводит звуковая карта, нету никакой разницы даже в том, что за оборудование ей по цифровой шине данные доставит. --- Сообщение объединено, 20 янв 2020 --- ЗЫ: присмотрелся к усилку на заднем фоне. Эти покрытые нитридом титана ручки, эти огромные овальные лампы, вынесенные аж наружу. Мещанство, граничащее с цыганством.
Какой слог! Очень спорный вопрос, граничащий с вендекапцом. Вин7 пользователи останутся с Вин7, также как армия пользователей ХР, которым end of support до лампочки (из ламповой ЭВМ). Остальным пользователям, чтобы как-то продолжать использовать это поделие с цифрой 10, не обновляя компы, остается либо искоренять вин-апдейт и вин-дефендер (чем они и занимаются, т.к. не каждый захочет по прихоти МС менять hdd на ssd, и добавлять ядер/гигов, чтобы хоть немного меньше оно лагало "изкоробки"), либо да, обновлять компы. По АВ, остается решить, Бесятка это такой троян, или у нее настолько мощное АВ, что не пускает ничего другого из АВ/троянов к себе? Я к тому, что на работе убиваюсь, пытаясь как-то это г на палочке с цифрой 10 клиентам настроить, чтобы лагало* меньше, и объяснять, что лагает, потому что там неискореняемый АВ/троян (нужное подчеркнуть). *чтобы меньше лагало, и чтобы функционал не пострадал, а то тут Скайп отвалится, там еще че вылезет в результате "оптимизации". Кстати, пишут, что добавление правил в сетевой экран 10-ки, с целью блочить телеметрию, не работает, т.к. в самом сетевом стеке захардкожено так, что эти адреса не заблочишь (привет Убивиц с его фильтрующим прокси на линукс). Имхо путь выживания МС - в новом каждые три года издании МСофисе, корпоративных доменных сетях и интеграции Линуховых ядер в Бесятку, но не в самой Бесятке (ее ISO вообще бесплатно дается чтобы скачать). Уберут (не уберут!) аверов, будет на каждый чих по новому Хромиум-based браузеру. Впаривать г и шпионить способы найдут. Сегодня созерцал Ccleaner Browser... Я пусть ненавижу импортозамещение, но вдруг АстраЛинукс допилят до вменяемости через пару-тройку лет? ( Вообще, вся эта тема с МС напоминает политику в России. Именно с ее набором критической массы своей недееспособности. Но политота не для Васм ) Но это все оффтоп. По теме - уже пару лет люди веселятся, ставя голосовых помощников болтать друг с другом, например 2 умные колонки с Алисами. Из серии "сначала тебя не замечают" "затем смеются над тобой" <- вы находитесь здесь "затем боятся тебя".. Так что видео "New Robot Makes Soldiers Obsolete" якобы от Бостон Дайнамикс, лет через 10 может стать не таким и фейковым.
Да все верно , уже как два года назад это стало приоритетным направлением. Даже придумали некую сущность - не 2д а 3д свертка. то есть свертка по времени (в данном случае кол-во кадров) Делал эксперименты с такими вещами. Удавалось довольно легко обучить сеть на какое-то одно действие с высокой вероятностью детекции. То есть примерно 97-98 % . Обучал на действие "пью кофе". Из интересного - за счет формы кружки можно делить действия - пью кофе или пиво.
Matan, > Текущая версия ArcaOS (основанная на OS/2 Warp 4.52) за июль 2019. Если атака на есчо одну ось(сколько же их уже..) будет стоить и будет нужна, то это всё быстро разберут на компоненты, что бы найти ошибки.
Ну тут мы столкнемся с проблемой вонакрая, выйдет какой-нить новый удаленный сплойт (по самбе там или любому другому сетевому протоколу) и все отрезанные от интернета тачки в локальной сети сразу станут уязвимы из-за одной, которая каким-то образом будет выставлена в интернет. Как бы с обновлениями остается некая надежда, что мелкомягкие успеют выпустить патч. Обновления через всус при этом не решают проблему утечки данных.
Rel, Это называется взлом через чёрный ход. На вонно-край отрабатывали методику. А сейчас так ломают роутеры. С наружи его не вскрыть. А вот через комп хозяина запросто. У 50% стоит VPN который уязвим. Так что патч от майкрософта не поможет, так как вирусы будут у вас на роутере.
1. бэкап. 2. песочницы. 3. не обижать лишний раз одмина == он хоть и незлопамятный, зато Злой и Память хорошая ======= линь же тоже весьма далёк от непробиваемости + вонакрай под вынь мб удивительно дружелюбен к вайну ЗЫ.. не удивлюсь, если скоро исчезнет даже сам намёк на такую надёгу
Как же я жду, чтобы кто нибудь наконец-то закодил масс малварь под ту же убунту.. какой-нибудь воннакрай или краб под линукс. Причем с лпе-рце, чтобы вот так раз - и сразу во всех новостях писали, а линуксоиды с их "авер не нужен "," вендопроблемы" чистили бы свои сервера месяцами, параллельно думая, что бы продать, чтобы расплатиться по штрафам.. И кто же сейчас сидит на ХР? Даже я с нее ушел на десятку, хотя, по факту, просидел 15 лет на этой ОС. Но если ни 1 прога не обновляется, + половина сайтов отвалилось из-за обновления ссл, то толку с такой ОС? Хочешь не хочешь, а сделаешь апгрейд. Так и с семеркой будет. Радует только то, что на торрентах выкладывают сборки вин10, где вырезают и юак, и защитник.. Т.е. оно почти как ХР работает.
M0rg0t, На XP есть сурки. Вот вам пример https://wasm.in/posts/415562/ задача лес тёмный, но по большей части хоть какую то обработку можно посмотреть. Все кто утверждает что то про XP это глупые троли которые ничего не понимают и не видели сурки ядра. --- Сообщение объединено, 25 янв 2020 --- M0rg0t, > Даже я с нее ушел на десятку Архитектура осталась не изменной, некоторые изменения - ядро стало более сложным, но не зная основ нет смысла что то смотреть более сложное. Под 10 не сурков, в ядре слишком много наворотов; незачем усложнять задачи, что работает на младших версиях, будет работать и на старших, а на оборот нет. Не адекватное обычно поведение тролей, которые поливают говном первую годную сборку нт, она отлично работает.
Ну это вряд ли с практической точки зрения возможно. У Линуксов зоопарк в плане софта и ядра, а для того, чтобы сделать действительно что-то существенное, нужно сплойтом подняться до рута. Чтобы сравниться с вонакраем, нужен сплойт для удаленного исполнения кодеса. Как бы обычно такие сплойты работают под строго определенные версии ядра и системных библиотек. Если учесть, что обновление всего софта, включая обновления ядра, проходит достаточно быстро и без перезагрузки, то мы сталкиваемся с проблемой, решать которую нецелесообразно ввиду того, что на десктопах Линуксы недостаточно распространены и сидят на Линуксах обычно люди, хоть как то разбирающиеся с системой. То есть разрабатывать вонакрай под Линукс слишком дорого в сравнении с потенциальным заработком от этого предприятия. --- Сообщение объединено, 25 янв 2020 --- Я правильно понял, Инде назвал деятку "первой годной сборкой венды"?