No.24846
Недавно одним аноном было обнаружено странное видео на ютубе, которое вывело его на целую сеть из сотен каналов, загружающих схожие видео. Вскрываем тему ИТТ.
Примеры каналов:
https://www.youtube.com/channel/UCq-2JuW2wKmqrmwx7yi9efQhttps://www.youtube.com/channel/UC_Zv5PvZ2ZKgF-1gIAe9SWAhttps://www.youtube.com/channel/UChB2_zus6KlfVgTUVntxN3AЧто выяснено:
- все названия видео записаны в формате <номер>;<ссылка на источник, либо некий код (хэш или ещё что-то)>;<дата (квартал)>
- никаких описаний к каналам нет, названия каналов видимо сгенерированы из рандомных имен и фамилий
- почти все видео содержат статичную картинку с мешаниной из цветных пикселей, либо это шум, либо какой-то код. Ранние видео были без картинки
- большинство записей — это подкасты, но иногда попадается музыка и рандомные передачи. Языки встречаются самые разные, не только английский. Скорее всего бот выкачивает любые файлы, содержащие слово podcast на странице. Примеры:
https://www.youtube.com/watch?v=GXHevPtZlsg https://promodj.com/djkorean/radioshows/7351131/Pasha_Koreec_724_Tancpol_Megapolis_89_5_FM_01_08_2022_724 https://www.youtube.com/watch?v=Kg43w9uRqDo https://tolkienaboutpod.podbean.com/e/the-silmarillion-chapter-20-of-the-fifth-battle-nirnaeth-arnoediad-with-the-swolhirrim/- изредка попадаются обычные видео, а не просто картинка с шумом+аудио, например:
https://www.youtube.com/watch?v=8Sy4JQJTOFQ https://www.youtube.com/watch?v=QhtaBAHmegk https://www.youtube.com/watch?v=UQr8GGBH1Ws- самое раннее известное видео: 2021-05-12 12:39:22,
https://www.youtube.com/watch?v=CDMxiX8DFPYАноны скриптами дополнительно обнаружили:
- существует как минимум 368 каналов и 1167171 видео, но это точно не все. Всё найденное собрано в таблицу
- в последние месяцы количество загрузок выросло, за июль 2022 залито 260к видео, это почти
over 9000 в день!
- почти все видео заливаются в промежуток между 15:00-18:00
Какие гипотезы:
>ML-теория: кто-то тренирует свою нейросетку на распознавание на слух по субтитрам, которые ютуб автоматически создает>Архивач-теория №1: кто-то архивирует подкасты для прослушивания>Архивач-теория №2: архив подкастов просто на всякий случай>Теория качающегося программиста: кто-то оттачивает навыки автоматизации и хранения контента в открытых сервисах>Мистификация/ARG/троллинг>Датамайнинг, поиск какой-то инфы по ключевым словам (а автосубтитры ютуба используются как бесплатная распознавалка речи)>Пиратство и монетизация чужого контента>Скилловому и небедному шизику так повелели голоса>ИИ гугла обезумелПока что ни одна гипотеза не подтверждена, нужны идеи для их проверок.
No.24847
ебать, а вот это уже интересно.. надо бы их в веб-архив сохранить, как можн больше
No.24852
Чет страшно…вспомнилась тема номерных радиостанций
No.24856
>>24852алсо, а я вспомнил историю с педофилами на Авито, которая пару месяцев назад в зоге двача случилась
No.24858
>>24846А сколько это теме уже?
No.24860
>>24858На реддите 2 месяца
No.24861
>>24860свежая тема. больше инфы нет?
No.24862
>>24846а что означает гекатонхейры?
No.24864
>>24862Гекатонхейры — Котт, Бриарей и Гигес — были потомками первобытных божеств Геи и Урана. Рожденные с пятьюдесятью головами и сотней рук каждый, их отец, Уран, ненавидел и боялся их. Вместе со своими братьями (титанами и одноглазыми циклопами) Гекатонхейры были заключены в тюрьму Ураном, который «обычно прятал их всех в тайном месте на Земле, как только каждый рождался, и не позволял им появиться на свет». на свет».
No.24867
>>24861Пока что всё самое важное из найденного здесь. На реддите неполный список каналов, да и они их даже не парсили.
No.24869
можешь кинуть треды на дваче, пожалуйста?
No.24873
но, мы можем быть уверенными в одном: это часть работы нейросетки
No.24874
>>24873Да не, качать подкасты и заливать на ютуб может несложный скрипт. Вопрос в том, нахуя это делается.
No.24876
>>24874вероятно тестовый выхлоп нейросеток. а на ютуб заливается потому что он 1. не упадёт от нагрузок и 2. не заебывает капчей.
No.24899
>>24846Там ещё в шортах хуйня какая-то.
No.24911
>>24904Например с одного из канала:
https://www.youtube.com/shorts/5zTD6OVrNrAПохоже риал нейросеть, там именно обрывки речи, получается.
No.24917
>>24899>>24911Скорее всего все короткие записи в шорты попадают.
No.24932
>>24914Вроде бы это просто записи с радио. Но почему же тогда так жутко…
No.24937
>>24921Согласно этой разъяснительной заметке шорты в отдельном порядке загружаются, как мини-соцсеточка.
No.24940
>>24917Вот нашел сурс для одной:
https://www.youtube.com/shorts/KHFLmsWPFhYwww.radioarabella.de/mediathek/audio/der-arabella-verkehrs-service-vom-dienstag-5-07-2022-um-060
Оригинал длится 8 секунд, а шорт 59 секунд, бот зачем-то добавил тишины. Оригинальное аудио вроде не изменено.
No.24942
Статья scp-1138 вспомнилась
Описание: SCP-1138 — бывший ███-ый передающий радиоцентр, расположенный в 3 километрах от города [УДАЛЕНО], Россия. С территории объекта периодически передается радиосигнал на интервале частот от ████ до ████ кГц (обозначен как SCP-1138-1). Уловить его удаётся не всегда, эксперимент 1138-C, проведенный ██.██.████, показал, что сигнал может уловить только определенный круг лиц (см. приложение 1138-C). Расшифровкой SCP-1138-1 в данный момент занимается д-р █████. На сегодняшний день нет никаких данных ни о том, какую он несет информацию, ни о том, что его транслирует. Наблюдения, проведенные во всех сооружениях радиоцентра, показали, что ни один из радиоприборов, находящихся на территории, не является источником сигнала. Есть предположение, что передача производится из помещений, расположенных под радиоцентром (обозначены как SCP-1138-2). На данный момент достоверно известно, что длительное прослушивание SCP-1138-1 пробуждает в человеке непреодолимое желание отправиться к объекту и спуститься в SCP-1138-2. Перезапись сигнала снижает шансы на возникновение этого эффекта (см. приложение 1138-D).
SCP-1138-2 — это сеть подземных коридоров и комнат, расположенных под Зоной 1138.
В данный момент Фонд не располагает сведениями о них: нет ни примерных размеров, ни информации о происхождении, ни о том, что находится внутри. Четыре опыта, описанные в приложении 1138-B, показали, что люди и дистанционно управляемые устройства пропадают, пройдя определенное расстояние вглубь SCP-1138-2. Однако, такого не происходит, если с подопытным имеется физический или зрительный контакт со стороны человека, находящегося в "безопасной зоне" — области в █ метрах от входа в SCP-1138-2. Также исчезновений не происходит при использовании цепочки из наблюдателей, поддерживающих зрительный контакт друг с другом. Необходимо только то, чтобы последний следящий человек находился в "безопасной зоне".
No.24943
>>24940И опять на странице в html есть слово podcast, поэтому бот скачал эту запись.
No.24947
>>24937Но видео доступно и по шорт версии, и по обычной. Это точно сам автор должен шорт добавлять, а не оно само?
https://www.youtube.com/shorts/KHFLmsWPFhYhttps://www.youtube.com/watch?v=KHFLmsWPFhY No.24949
>>24947Наверно сам, они таки по длительности различаются.
No.24950
Просто в шорте убрана вся длительная пауза после речи.
No.24951
>>24949Таки нет, я проверил сейчас, залил короткое видео на свой канал, и оно сразу в шортсах и по обычной ссылке стало доступно. То есть шортс это тупо интерфейс к обычной версии.
>они таки по длительности различаютсяСтранно, у меня оба 59 секунд идут.
No.24952
>>24951А, извиняюсь, просто интерфейс шортов непривычный, думал у меня видео новое проигрывается, потому что старое закончилось. Ну… А разгадка проста
БЕЗНОГNМ No.24958
Тема интересная, но разгадка, наверняка, будет какая-нибудь тривиальная, как было с Webdriver Torso
No.24959
>>24958Да, скорее всего кто-то просто нейросети тренирует таким образом.
No.24960
Стеганограммы. В звуке и видео закодированы данные, расшифровать которые можно только зная ключ.
No.24979
Теория с датамайнингом норм.
Вопрос что пытаются найти? Контент разный. Новости, чтение религиозной литературы, какой то местный подкаст. Музыка может быть как побочный эффект, но там и текста особо не бывает.
No.24981
>>24979Ну если это человек/группа какая-то делает, не связанная с ютубом, то последний должен же был заметить?
А если это сам Тытруб, то что ему искать у себя сам?
Я бы на нейронку ставил, причем явно связанную с самим ютубом
No.24982
В конфу из OП поста залетайте , там новые данные
No.24983
>>24982Сорян
В OП посте нет конфы.
Вот адрес ТГ /Hecatoncheires_mys
No.25023
>>24981>если это человек/группа какая-то делает, не связанная с ютубом, то последний должен же был заметитьДля ютуба даже 10к видео у день это мелочь. Тем более с каждого канала заливается только по 50 видео в день.
>связанную с самим ютубомОчень странно, что ютуб пиздит чужие подкасты и выкладывает в общий доступ, причем часть видео этого бота как раз блокируются автоматом из-за правообладателей.
>нейросетьЕсли это нужно для обучения нейронки распознавать речь, то почему бы не использовать кучи видео с подкастами, которых дохрена на ютубе. Один хуй, данные в обоих случаях будут грязные и неразмеченные.
No.25024
Ребята, не стоит вскрывать эту тему. Вы молодые, шутливые, вам всё легко. Это не то. Это не Чикатило и даже не архивы спецслужб. Сюда лучше не лезть. Серьёзно, любой из вас будет жалеть. Лучше закройте тему и забудьте, что тут писалось. Я вполне понимаю, что данным сообщением вызову я ебу собак дополнительный интерес, но хочу сразу предостеречь пытливых — стоп. Остальные просто не найдут.
No.25035
>>24846Новая инфа:
Был найден канал karl abulencia
https://www.youtube.com/channel/UCeUdgfjI4LV3x0jQyPGIUXA с похожими видео, но принадлежащий реальному человеку.
По нему вышли на блогера (
https://www.youtube.com/watch?v=ssFUA5uM_z4,
https://www.youtube.com/watch?v=z7Ltx_SzTkw), который рассказывал о сети каналов как в ОП-посте, но только они все были с одинаковым именем karl abulencia. Ролик выпущен 17 мая 2021 г., каналы начали появляться в конце марта. После выпуска ролика, многие стали подражать боту, создавать похожие каналы и заливать туда всякую крипоту для троллинга.
Блогер предложил две гипотезы:
1) некий человек или компания предоставляет услуги другим компаниям по перезаливу подкастов на ютуб, чтобы их не могли залить другие
2) кто-то пиздит подкасты, чтобы получить часть монетизации, если их зальет кто-то ещё (хуй знает, реально ли такое работает)
Сейчас оригинальные каналы Карла удалены, может из-за внезапной популярности после ролика, а может они просто были тестовыми.
No.25932
Бамп.
No.25939
>>25932Смотри, чтоб тебя не убрали за интерес к неудобной теме
No.26032
>>26028Чтобы затралить тех, кто собрался меня убрать.
No.26041
>>26037Ютуб же пережимает и перекодирывает всё. Разве там можно что то из перемолотого ютубом достать?
No.26359
>>26041Можно, если кодировать алгоритмами, устойчивыми к искажениям. Но:
- картинка статичная и очень шакальная (100х100), значит получится спрятать мизерное количество информации
- ранние видео были с просто чёрной картинкой, видимо эти пикчи добавили потом как какой-то костыль
- зачем так палиться картинкой с шумом и странными названиями, когда данные можно встроить незаметно
- зачем вообще парсить сотни сайтов с подкастами по несколько часов на видео ради одной картинки, если это добавляет огромный оверхед и из-за этого часть видео блочит ютуб
No.38966
Это тесты гугла. Один из вариантов теста: проверка алгоритмов сжатия.
Может, просто нейронку тренируют, чтобы на шуме не выдавала залупу в субтитрах
No.48965
>>38966Скорее всего, но стеганографию не следует исключать'