Как найти файл по имени в интернете

ru.freepik.com
ru.freepik.com

FTP — это один из старейших протоколов для передачи файлов по сети, который появился ещё в 1971 году, более чем за 20 лет до HTTP (протокола, который используется для загрузки веб-страниц и файлов в популярных браузерах).

В настоящий момент FTP чаще всего применяется для двух типов задач:

1. Для доступа к удаленным хостам, на которых хранятся файлы сайтов (скрипты, html-страницы, картинки и т.д.).

2. Для предоставления доступа к каким-либо файлам, предназначенным для узкого круга людей (в этом случае для скачивания нередко бывает необходим пароль), а также к контенту, индексирование которого поисковыми системами по каким-либо причинам нежелательно (в частности, из-за нарушения авторских прав).

Например, FTP-сервер университета, на котором преподаватели и старосты групп выкладывают учебные материалы или FTP-сервер регионального интернет-провайдера, с которого абоненты могут скачивать “пиратские” фильмы.

А ещё бывают публичные FTP-сервера, на которые выкладывают “всё подряд”: фильмы, музыку, книги, программы, офисные документы и прочие файлы самых разных форматов и содержания.

Информацию на них нельзя найти с помощью Google и “Яндекс”. Для этого потребуются специальные сервисы. Например:

https://www.mmnt.ru/
https://www.mmnt.ru/

Mamont (mmnt.ru) — позиционирует себя как FTP-поисковик с самым большим числом проиндексированных файлов (4 миллиарда 452 миллиона 881 тысяча 154).

При использовании этого сервиса не забудьте переключить режим “Поиск в интернете” на режим “Поиск файлов”.

Napalm FTP Indexer (searchftps.net) — проиндексированных файлов у него намного меньше (380 миллионов 735 тысяч 924), но зато сервис оперативно удаляет из выдачи всё “старье”, ссылки на которое стали неактивны (в отличие от mmnt.ru)

Krasfs (krasfs.ru) — поисковик по FTP и торрентам. Количество проиндексированных файлов не указано, но судя по числу результатов по разным запросам, оно намного меньше, чем у первых двух сервисов.

Например. Запрос: “Иванов”. Mamont — 9 тысяч 665, Napalm FTP Indexer — 1175, Krasfs — 12 файлов.

Список актуальных FTP-поисковиков постоянно меняется. Многие из когда-то успешно выполнявших свою задачу резко перестают работать (как это случилось с FileWatcher или FileMare), но в тоже время регулярно появляются новые (и часто быстро исчезают).

А теперь давайте посмотрим, что интересного можно попробовать найти на публичных FTP-серверах.

1. Музыка, книги и фильмы

Поисковиком Mamont проиндексировано:

26 миллионов 883 тысячи mp3-файлов.

2 миллиона 256 тысяч avi-файлов

454 тысячи mov-файлов

214 тысяч epub-файлов

247 тысяч fb2-файлов

На публичных FTP-серверах лежит просто море развлекательного контента, но большую его часть можно найти и скачать на обычных http-сайтах.

В чем же преимущества использования публичных FTP-серверов?

Google Chrome
Google Chrome

Во-первых, это возможность скачивать файлы не по одному, а сразу огромными тематическими архивами, в которых есть сразу несколько сотен или тысяч песен, книг или фильмов. И делать это со скоростью гораздо большей чем при скачивании с торрентов.

Во-вторых, это возможность найти редкие файлы, которые не нашлись с помощью обычного поисковика.

Например, неофициальные аудиоверсии литературных произведений или редкие песни ныне малоизвестных артистов.

Также на FTP-серверах можно встретить файлы, которые удалены с http-сайтов в связи с обращением правообладателей. Например, недавно вышедшие книги популярных авторов, вышедшие в крупнейших российских издательствах.

Перед тем как скачивать что либо с публичных FTP-серверов следует проверить, не защищен ли файл авторским правом.

И если защищен, то ни в коем случае не выкладывать на свои сайты/в профили в соцсетях и не распространять его каким-либо еще образом.

2. Базы данных

https://www.searchftps.net/
https://www.searchftps.net/

Публичные сервера полны различными текстовыми файлами, электронными таблицами и базами данных, в которых есть какие-либо персональные или другие ценные данные.

MDB ACCDB Viewer
MDB ACCDB Viewer

Например, по запросу “база мобильных” Napalm FTP Indexer нашел базу с телефонными номерами, адресами и почтовыми индексами десятков тысяч жителей Украины.

Вариантов запросов, по которым можно попытаться найти базы с персональным данными тысячи — “baza_nomerov”, “nomera_baza”, “telephony”, “telephony_moskva” и т.д.

Несколько советов для успешного поиска во всех категориях

Набирать предполагаемые названия файлов минимум тремя способами — транслитом, по-русски и по английски. Например:
“yabloko”, “яблоко” и “apple”.

Также пробовать французский, испанский, немецкий и другие языки, а также пробовать предугадать ошибки (“eblako”, “йаблоко” и “aple”).

Помнить о том, что когда люди называют файлы, то часто впадают в измененное состояние сознания и полностью отключают рациональное мышление. Порой какой-то важный файл находится только при 20-м переборе варианта предполагаемого названия (“ааааpppllleee”).

Если результатов по какому-то запросу слишком много, то для уточнения можно добавить название расширения файла (txt или xls).

Помнить о том, что новые файлы выкладываются появляются каждый день (и часто очень быстро исчезают). Если вам нужен какая-то конкретный файл то проверять не “мелькнул” ли он на каком-нибудь публичном FTP-сервере стоит раз в несколько дней.

3. Материалы для учебы и готовые студенческие работы

https://www.mmnt.ru/get?st=%F0%E3%E3%F3&cn=&in=f
https://www.mmnt.ru/get?st=%F0%E3%E3%F3&cn=&in=f

По названию вуза, кафедры, предмета, номеру группы или фамилии преподавателя можно найти готовые лабораторные работы, рефераты, доклады, дипломы, ответы на билеты и прочие полезные файлы.

А если очень-очень-очень повезет, то можно найти целый архив какого-нибудь выпускника вашей специальности, в котором будут лежать все его учебные материалы.

4. Сведения об определенном человеке

https://www.mmnt.ru/
https://www.mmnt.ru/

Поисковики по публичным FTP-серверам — отличный дополнительный инструмент при сборе информации о человеке. Чьи-то личные данные там можно найти, если искать:

  • файлы по фамилии или полному ФИО;
  • файлы по названию школу, вуза или суза;
  • файлы по названиям организаций (мест работы);
  • файлы по названию места проживания (населенного пункта или района города).

Работа эта долгая и кропотливая, но порой может стать неожиданно эффективной и завершиться нахождением полных паспортных данных вместе с актуальным домашним адресом.

Как скачивать файлы по FTP?

https://www.searchftps.net/
https://www.searchftps.net/

Если нужно скачать один файл, то надо просто скопировать ссылку на него из результатов поиска в адресную строку браузера.

А вот если нужно скачать сразу целую папку с файлами или несколько папок, то удобнее воспользоваться FTP-клиентом.

Я уже много лет пользуюсь бесплатным FileZilla, еще был период перехода на CyberDuck и он мне тоже нравился. Но для простого скачивания файлов и папок подойдет — любой FTP-клиент.

Приложение FileZilla
Приложение FileZilla

Короткая инструкция для FileZilla:

Копируем номер сервера из ссылки в поле “Хост”

Например, если ссылки ftp://78.139.97.87/Detaym/Detskie_pesni/ то номер хоста будет — 78.139.97.87

Оставляем пустым поля “Имя пользователя” и “Пароль”

Нажимаем на кнопку “Быстрое соединение”.

В панели слева выбираем папку, в которую хотим скачать нужные файлы (например, “Загрузки” или “Документы”).

Перетаскиваем в нее значки папок с интересным нам контентом из правой части в левую часть.

Ждем завершения загрузки (и только после этого закрываем FTP-клиент).

001На странице ddlsearch.free.fr введите имя искомого файла, затем выберите требуемый поисковый сервис (например, «Duck-DuckGo») и один из двухсот перечисленных файлообменников. Нажмите кнопку «Search», и перед вами откроется новое окно, в котором выбранная служба поиска отобразит все найденные данные.

Сервис rapid-search-engine.com проводит поиск по 42 файлообменникам. В разделе «Advanced» вы можете осуществить поиск конкретных типов файлов. Результаты поиска будут четко структурированы.

Страница rapid4me.com кажется самой минималистичной в плане интерфейса и поисковых опций. Но первое впечатление обманчиво: результаты поиска получится отсортировать и отфильтровать по своему желанию. Кроме того, вы можете выбрать или исключить некоторые файлообменники из поиска, а также отсортировать результаты по категориям и размеру файла.

Внимание: многие файлы, которые хранятся на файлообменных сервисах, являются незаконными, а также могут содержать вирусы и трояны.

Огромное количество информации в Интернете хранится не в виде привычных html-страниц, а в виде файлов иных форматов. Это изображения, музыка, видео, программы и различная другая информация.

При поиске файла, если точное его название известно, то можно ввести его в поле запроса поисковой системы. Если точное имя неизвестно, то можно ввести предположительное расширение файла, ту часть его имени, которая известна, а также краткое описание этого файла.

Например, надо найти файл qwer.dll из дистрибутива офисного пакета с условным названием SuperOffice. Этот файл необходим, так как на компакт-диске с установочными файлами пакета он оказался поврежден и система отказывается продолжать установку без него. Откройте браузер, войдите на сайт одной из поисковых систем, введите запрос qwer.dll. Если в результате поиска не обнаружится ни одной ссылки на требуемый файл и ни одной ссылки на страницу, которая содержала бы ссылку на требуемый файл, то введите поисковый запрос qwer.dll SuperOffice.

Отличие этой поисковой системы от обычных поисковых систем, таких как Yandex, Rambler, Aport и т.п. в том, что эти системы осуществляют поиск на WWW серверах и html страницах по их содержимому, в то время как FileSearch ищет файлы на FTP-серверах по именам самих файлов и каталогов. Если вы ищете какую-либо программу, или еще что-то, то на WWW-серверах вы скорее найдете их описание, а с FTP-серверов вы сможете перекачать их к себе.

Google[править]

Сервис расширенного поиска в Google позволяет показывать в окне поиска только файлы выбранного формата, либо наоборот исключать файлы этого формата из списка найденных документов:

  • Adobe Acrobat PDF (pdf);
  • Adobe Postscript (.ps);
  • Autodesk DWF (.dwf);
  • Google Планета Земля KML (.kml);
  • Google Планета Земля KMZ (.kmz);
  • Microsoft Excel (.xls);
  • Microsoft Word (.doc);
  • Rich Text Format (.rtf);
  • Shockwave Flash (.swf).

Яндекс[править]

Сервис расширенного поиска в Яндекс позволяет показывать в окне поиска только файлы выбранного формата:

  • HTML;
  • PDF (Adobe Acrobat);
  • RTF (Rich Text Format);
  • DOC (Microsoft Word);
  • XLS (Microsoft Excel);
  • PPT (Microsoft Powerpoint);
  • FLASH (Adobe Flash).

Поисковые серверы FTP[править]

Если требуемый файл не удалось найти с помощью обычных поисковых систем, то воспользуйтесь специальным поиском по FTP-серверам.

Поисковые серверы FTP, например, proisk.ru, осуществляют поиск по FTP-серверам аналогично обыкновенному поиску. Зайдя на сайт одной из поисковых систем FTP, введите в строке для запроса ключевое слово (например, ‘zemfira’ или ‘netscape’), шаблон (например, ‘far*.exe’ или ‘*.mpg’), имя искомого файла вместе с расширением либо часть имени и нажмите кнопку Найти (Search) рядом с полем для ввода. Через некоторое время на экране появится список найденных в Интернете файлов и папок, которые содержат в своем имени или в пути к себе текст, введенный вами в поисковом запросе. Перемещение по страницам результатов поиска происходит так же, как это делалось в обычных поисковых системах. При FTP-поиске не следует вводить описание файла, иначе ни один файл найден не будет и страница с результатами поиска окажется пустой.

Ссылки[править]

  • krasfs.ru
  • proisk.ru
  • filemare.com

Как искать в интернете малоизвестные и непопулярные файлы

Несколько неочевидных способов найти в Сети то, чего нет на популярных ресурсах.

Как искать в интернете малоизвестные и непопулярные файлы

Иногда случается так, что вы хотите скачать свободно распространяемый музыкальный альбом 2007 года, выпущенный исполнителем, которого знает три с половиной человека. Вы находите торрент-файл, запускаете его, загрузка доходит до 14,7% и… всё. Проходят дни и недели, а загрузка стоит на месте. Вы начинаете искать альбом в Google, рыщете по форумам и наконец находите ссылки на какие-нибудь файлообменники, но они уже давно не работают.

Такое происходит всё чаще и чаще — правообладатели постоянно закрывают полезные ресурсы. И если популярный контент найти по-прежнему не проблема, отыскать какой-нибудь телевизионный сериал семилетней давности на испанском языке может быть крайне трудно.

Что бы вам ни понадобилось в интернете, есть ряд способов это отыскать. Мы предлагаем все нижеперечисленные варианты исключительно для ознакомления с контентом, но ни в коем случае не для воровства.

Usenet

Usenet — распределённая сеть серверов, между которыми синхронизируются данные. Структура Usenet напоминает гибрид форума и электронной почты. Пользователи могут подключаться к специальным группам (Newsgroups), что-то в них читать или писать. Как и в случае с почтой, у сообщений есть тема, которая помогает определить тему группы. Сегодня Usenet используется по большей части для обмена файлами.

До 2008 года крупные провайдеры Usenet хранили файлы лишь 100–150 дней, однако затем файлы стали храниться вечно. Более мелкие провайдеры оставляют контент на 1 000 и более дней, чего зачастую тоже достаточно.

Примерно в середине 2001 года Usenet стали замечать правообладатели, из-за чего провайдерам пришлось удалять защищённый авторским правом контент. Но энтузиасты быстро нашли обходной путь: они стали давать файлам запутанные названия, защищать архивы паролями и добавлять их на специальные сайты, к которым можно получить доступ только по приглашению.

В России о существовании Usenet почти никто не знает, чего не скажешь о странах, где власти усердно борются с пиратством. В отличие от протокола BitTorrent, в Usenet нельзя определить IP-адрес пользователя без помощи провайдера сервиса или поставщика интернет-услуг.

Как подключиться к Usenet

В большинстве случаев бесплатно подключиться не выйдет. Придётся довольствоваться либо малым временем хранения файлов, либо низкой скоростью, либо доступом только к текстовым группам.

Провайдеры предлагают два типа платного доступа: ежемесячную подписку с неограниченным объёмом загружаемых данных или неограниченные по времени тарифы с лимитированным трафиком. Второй вариант — для тех, кому лишь иногда требуется что-то скачать. Крупнейшие поставщики таких услуг — Altopia, Giganews, Eweka, NewsHosting, Astraweb.

Теперь нужно понять, где брать NZB-файлы с метаинформацией — что-то вроде торрент-файлов. Для этого используются специальные поисковые движки — индексаторы.

Индексаторы

Публичные индексаторы полны спама и вирусов, но они всё ещё годятся для поиска файлов, загруженных пять или более лет назад. Вот некоторые из них:

  • binsearch.info;
  • binzb.com;
  • nzbindex.com;
  • nzbking.com.

Бесплатные индексаторы, требующие регистрации, больше подходят для поиска новых файлов. Они хорошо структурированы, у контента есть не только названия, но и описания с картинками. Можно попробовать следующие:

  • nzbfinder.ws;
  • nzbid.org;
  • nzbnoob.com;
  • nzbfriends.com;
  • usenet-crawler.com;
  • drunkenslug.com;
  • nzbgeek.info.

Также существуют индексаторы только для определённых типов контента. Например, anizb подойдёт поклонникам аниме, а albumsindex — тем, кто ищет музыку.

Скачивание из Usenet

В качестве примера возьмём «Фрейзер Парк» (The FP) — малоизвестный фильм 2011 года, вариант которого в разрешении 1080p отыскать практически невозможно. Нужно найти NZB-файл и запустить его через программу вроде NZBGet или SABnzbd.

Заходим на nzbking.com и ищем the.fp.2011.

medium.com

Здесь доступна только одна часть из 3 867. Вы не можете скачать такой файл, он помечен красным.

medium.com

Защищённые паролями файлы (Password protected) обычно являются фальшивками.

medium.com

На второй странице видим нормальный DVDRip — подходящий размер файла, никаких паролей.

medium.com

На этой странице есть BDRip и несколько нормальных DVDRip, судя по размеру и дате загрузки.

medium.com

Выберите нужный фильм, нажмите «Загрузить NZB» (Download NZB) и импортируйте файл в NZBGet или SABnzbd, в которых необходимо ввести данные аккаунта Usenet. Когда скачивание закончится, программа сама распакует архивы и удалит их.

IRC / DCC / XDCC

IRC — старый протокол для текстового общения, из-за своей простоты по-прежнему популярный среди разработчиков, администраторов торрент-трекеров и любителей аниме. IRC поддерживает передачу файлов посредством DCC.

Сегодня существуют IRC-каналы и даже серверы, предназначенные исключительно для передачи файлов с помощью скрипта XDCC. Он популярен благодаря простоте использования и администрирования ботов: пользователю достаточно загрузить файл на FTP, а бот автоматически добавит его в индекс и уведомит об этом членов канала.

Есть специальные приватные IRC-сети с программами, новыми и не очень фильмами, музыкой и играми. Агентства по борьбе с нарушителями авторских прав об XDCC почти ничего не знают, поэтому в таких сетях можно найти много того, чего нет в других местах.

Индексаторы

У большинства XDCC-ботов есть веб-интерфейсы. Контент общей направленности можно найти здесь:

  • ixirc.com;
  • xdcc.eu;
  • sunxdcc.com.

Аниме можно найти на nibl.co.uk.

Как качать через IRC

Вам потребуется IRC-клиент. Подойдёт почти любой — подавляющее большинство поддерживает DCC. Подключитесь к интересующему вас серверу и начинайте качать.

Крупнейшие серверы с книгами:

  • irc.undernet.org, комната #bookz;
  • irc.irchighway.net, комната #ebooks.

Фильмы:

  • irc.abjects.net, комната #moviegods;
  • irc.abjects.net, комната #beast-xdcc.

Западная и японская анимация:

  • irc.rizon.net, комната #news;
  • irc.xertion.org, комната #cartoon-world.

Для поиска файлов можно использовать команды !find или @find. Бот отправит результаты в виде личного сообщения. Если возможно, отдавайте предпочтение команде @search — она запускает специального бота, который предоставляет результаты поиска в виде одного файла, а не огромного потока текста.

Попробуем скачать «Как музыка стала свободной» (How Music Got Free) — книгу о музыкальной индустрии, написанную Стивеном Уиттом (Stephen Witt).

medium.com

Бот отреагировал на запрос @search и отправил результаты в виде ZIP-файла по DCC.

medium.com

Отправляем запрос на скачивание.

medium.com

И принимаем файл.

medium.com

Если вы нашли файл с помощью индексатора, то вам не нужно искать его на канале. Просто отправьте боту запрос на загрузку, используя команду с сайта индексатора.

DC++

В DC-сети все коммуникации осуществляются через сервер, называемый хабом. В ней можно искать конкретные типы файлов: аудио, видео, архивы, документы, образы дисков.

Делиться файлами в DC++ очень просто: достаточно поставить галочку напротив папки, к которой вы хотите предоставить общий доступ. За счёт этого можно отыскать что-то совершенно невообразимое — что-то, о чём вы сами уже давно забыли, но что может кому-то внезапно пригодиться.

Как качать через DC++

Подойдёт любой клиент. Для Windows лучшим вариантом является FlylinkDC++. Пользователи Linux могут выбирать между EiskaltDC++ и AirDC++ Web.

Подключитесь к разным хабам — чем больше, тем лучше. Список хабов есть в самом клиенте, также их можно найти по специальной ссылке.

Поиск и загрузка реализованы удобно: введите запрос, выберите тип контента, нажмите «Искать» и два раза щёлкните по результату, чтобы скачать файл. Также можно просмотреть список всех открытых пользователем файлов и загрузить все файлы из выбранной папки. Для этого нужно правой кнопкой мыши щёлкнуть по поисковому результату и выбрать соответствующий пункт.

medium.com

Если что-то не нашли, попробуйте позже. Зачастую люди включают DC-клиент только когда им самим нужно что-то загрузить.

eDonkey2000 (ed2k), Kad

Как и DC++, ed2k — протокол децентрализованной передачи данных с централизованным хабом для поиска и соединения пользователей друг с другом. В eDonkey2000 можно найти почти то же самое, что и в DC++: старые сериалы с разной озвучкой, музыку, программы, игры, старые книги для программистов, а также книги по математике и биологии. Впрочем, есть здесь и новые релизы.

Как качать через eDonkey2000 / KAD

Вам нужен ed2k-клиент. Хороший выбор для Linux — aMule. Пользователям Windows подойдёт eMule, несмотря на то что он не обновлялся с 2011 года.

Поиск и скачивание реализованы почти так же, как в DC++. Введите запрос, получите результаты от онлайн-пользователей, два раза щёлкните по нужному файлу, чтобы загрузить его.

Поищем «Мы живём на людях» (We Live In Public) — малоизвестный документальный фильм 2009 года, в котором рассказывается об интернете 90-х годов.

Введите запрос, нажмите «Пуск» (Start) и ждите, пока не появятся результаты.

medium.com

Два раза щёлкните по файлу, чтобы начать загрузку.

medium.com

Скачивание одного файла может длиться недели и даже месяцы. По какой-то непонятной причине у большинства пользователей ed2k невероятно низкая скорость соединения с интернетом, причём в онлайн они выходят лишь на несколько часов в неделю. Поэтому запаситесь терпением.

Soulseek

Это централизованная сеть для прямого обмена музыкой. Известна в IDM-сообществе и всё ещё находится в активной разработке. Здесь есть группы и приватные чаты, возможность делиться файлами с друзьями и поиск по битрейту.

Самый популярный клиент — официальный SoulseekQt. Есть также два неофициальных — Nicotine+ и Museek+.

BitTorrent DHT

Все современные BitTorrent-клиенты могут искать пиров через распределённую хеш-таблицу (DHT). Эта функция используется DHT-индексаторами: они получают торрент-файлы с данными из сторонних DHT-запросов и сохраняют их в свои базы. Через такие индексаторы можно искать редкие и неопубликованные торрент-файлы или похожие на них, но с большим количеством раздающих.

Список некоторых популярных индексаторов:

  • bitsnoop.com;
  • btdb.in;
  • digbt.org;
  • btdb.in;
  • btkitty.bid;
  • kikibt.net;
  • btdig.com.

DHT-индексаторы известны тем, что долго не живут. Поэтому что-то из списка на момент публикации материала уже может не работать.

Сайты и FTP-серверы для обмена файлами

Почти в каждом регионе есть свои сайты для обмена файлами. Например, среди чехов популярен uloz.to, среди французов — zone-telechargement.ws, а среди поляков — chomikuj.pl.

FTP-индексаторы редко помогают найти что-то нужное, но попытаться всё равно можно:

  • mmnt.net;
  • searchftps.net;
  • filemare.com;
  • krasfs.ru.

Сайты для поиска на файлообменниках тоже малоэффективны, но не стоит забывать и о них:

  • filediva.com.

Читайте также:

  • 8 поисковиков, которые лучше, чем Google →
  • Все секреты поиска в Google: найдётся действительно всё →
  • 4 специальных браузера для анонимного сёрфинга →

Ищем и скачиваем непопулярные и старые файлы в интернете

Время на прочтение
14 мин

Количество просмотров 194K

Преимущественно медиафайлы. На полном серьезе, без шуток.

Введение

Бывает, случается так, что вы хотите скачать альбом 2007 года исполнителя, который кроме вас известен 3.5 людям, какой-нибудь испанский ска-панк или малопопулярный спидкор европейского происхождения. Находите BitTorrent-раздачу, ставите на закачку, быстро скачиваете 14.7%, и… все. Проходит день, неделя, месяц, а процент скачанного не увеличивается. Вы ищете этот альбом в поисковике, натыкаетесь на форумы, показывающие ссылки только после регистрации и 5 написанных сообщений, регистрируетесь, флудите в мертвых темах, вам открываются ссылки на файлообменники вроде rapidshare и megaupload, которые уже сто лет как умерли.

Попытка скачать хотя бы один файл
Увы, частая ситуация в попытке хоть что-то скачать

Такое случается. В последнее время, к сожалению, случается чаще: правообладатели и правоохранительные органы всерьез взялись за файлообмен; в прошлом году закрылись или были закрыты KickassTorrents, BlackCat Games, what.cd, btdigg, torrentz.eu, EX.ua, fs.to, torrents.net.ua, и еще куча других сайтов. И если поиск свежих рипов фильмов, сериалов, музыки, мультиков все еще не представляет большой проблемы, несмотря на многократно участившееся удаления со стороны правообладателей контента из поисковых систем, торрент-трекеров и файлообменников, то поиск и скачивание оригинала (DVD или Blu-Ray) фильмов и сериалов или просто ТВ-рипов 7-летней давности на не-английском и не-русском языке — не такая уж простая задача.

Зачем это нужно?

  • Отсутствие некоторых релизов на дисках
В случае с видео, иногда случается так, что картину дублируют и транслируют по телевидению в какой-то стране, а на дисках не выпускают. Капперы выкладывают ТВ-рипы в файлообменные сети или BitTorrent, затем выходят DVD в другой стране, без соответствующей аудиодорожки, например, французской, и люди вынуждены либо качать DVDRip с хорошим качеством видео без французской дорожки, либо ТВ-рип с ней. Проходит время, ТВ-рип раздают все меньше и меньше людей, он удаляется с файлообменников из-за неактивности, и все — французский релиз становится скачать гораздо сложнее.
Проблему можно было бы решить, совместив аудиодорожку из ТВ-рипа с доступным видео из DVD, что не всегда так просто, как кажется. Этим никто не занялся и ТВ-версия умерла.

  • Отличие контента ТВ- и DVD-версии
Например, мультсериал «Дарья» лишился почти всей музыки, которая была в ТВ-версии, из-за юридических проблем с перелицензированием. Долгое время люди, желающие посмотреть данный сериал, стояли перед выбором: либо полноценная ТВ-версия с музыкой и плохим качеством видео, либо DVD-версия с хорошим качеством, но без музыки.

  • Региональные различия
Справедливы как для видео, так и для музыки. Мультсериал W.I.T.C.H. выпускался с 4 разными опенингами, только один из которых попал на DVD.
Зачастую, музыкальные альбомы, выпускаемые для рынка Японии, содержат бонусные треки, которых нет в других изданиях.

Как вы уже поняли, причин может быть множество. Где искать непопулярные и старые файлы?

Usenet

Usenet — распределенная сеть из серверов, синхронизирующих информацию между собой. Структура Usenet напоминает что-то среднее между форумами и электронной почтой: в «новостных группах» (так называются тематические категории в Usenet) сообщения имеют древовидную структуру, пользователи могут подписываться на конкретные группы, читать и писать в них. Как и в Email, у сообщений есть тема (subject), которая позволяет ориентироваться в содержании дискуссий. Сейчас используется преимущественно для обмена файлами.

История Usenet

Появившаяся в 1979 году, в до-интернетовскую эпоху сеть использовала прямые модемные соединения для передачи информации через UUCP и была инструментом преимущественно текстового общения. В свое время Usenet конкурировал с BBS, существовали специальные шлюзы в и из Fidonet. С приходом интернета, сообщения Usenet начали передаваться по TCP/IP, используя протокол NNTP, который остается относительно используемым и вне Usenet (например, можно читать огромное количество публичных списков рассылок через gmane и RSS-фиды через gwene, причем, в отличие от списков рассылок, вы всегда можете посмотреть всю историю, а не только сообщения с момента вашей подписки).

Чтение email-рассылок через NNTP

С увеличением пропускной способности линий, улучшением модемов и их протоколов, к девяностым сеть уже вовсю использовали для передачи бинарных файлов: вареза, музыки, видеофайлов. Делалось это примерно таким же образом, как и в Email: файл разбивается на небольшие части (тома), кодируется печатными символами в 7-битной кодировке с использованием Base64 или uuencode, и отправляется в ньюсгруппу. Кодирование в 7 бит добавляет около 30% накладных расходов на передачу файла. Спецификация позволяет использовать большинство символов из ASCII-таблицы, поэтому в 2001 году появляется алгоритм передачи файлов yEnc, увеличивающий файл всего на 1-2%, экранируя только символы переноса строки, NULL-байты и символ равенства (=). Им пользуются и по сей день.
Для контроля целостности и восстановления поврежденных или отсутствующих данных используется Parchive.

Загрузка файлов в Usenet

До 2008 года крупнейшие Usenet-провайдеры хранили бинарные файлы около 100-150 дней с момента их загрузки (так называемый retention time, срок хранения файлов). С 2008 года самые крупные провайдеры вообще перестали что-либо удалять, и на текущий момент можно без проблем скачать файлы восьмилетней давности, а провайдеры поменьше выставили retention time в 1000+ дней, что тоже немало. К этому моменту текстовое общение в Usenet сошло на нет и сеть использовалась преимущественно для хранения и передачи файлов.

Начиная где-то с середины 2011 года за сетью начали следить правообладатели, из-за чего Usenet-провайдерам пришлось удалять файлы, что сильно повлияло на целостность релизов. Некоторые провайдеры сделали автоматизированные системы удаления файлов, чтобы правообладатели могли удалять загрузки самостоятельно. Дабы предотвратить или хотя бы замедлить обнаружение файлов правообладателями, энтузиасты начинают загружать файлы с обфусцированными именами, в архивах под паролями, и добавляют их в каталоги систем индексации релизов (indexers), доступ к которым, как правило, осуществляется либо за деньги, либо по приглашениям. Обычными способами ни найти, ни скачать такие релизы не удастся.

В современной России о Usenet почти никому не известно, хотя рунет зарождался именно с него, по протоколу UUCP, и был одним из двух рабочих каналов для связи с Западом во время путча 1991 года (второй — FIDO). Сейчас Usenet наиболее популярен в странах, законы которых позволяют штрафовать пользователей за скачивание или раздачу контента, защищенного авторским правом, например, в Германии. В отличие от BitTorrent, узнать IP-адресы пользователей Usenet сторонней организации невозможно.

Подключение к Usenet

Полноценно пользоваться сетью бесплатно, скорее всего, не получится: либо столкнетесь с низким временем хранения файлов (10-30 дней), либо с низкой скоростью, либо получите доступ только к текстовым группам. Придется купить доступ у какого-нибудь провайдера или их реселлеров. Большинство провайдеров имеют два типа тарифов: месячный абонемент без ограничений по количеству скачанного (unlimited) и пакет трафика без ограничения по времени (block). Если вы собираетесь качать файлы из сети пару раз в месяц, block-доступа вам хватит надолго.
Крупнейшими провайдерами являются Altopia, Giganews, Eweka, NewsHosting, Astraweb.

Теперь нужно каким-то образом получить nzb-файл с метаинформацией, это что-то вроде .torrent-файла. Если у вас его нет, нужно воспользоваться поисковиком-индексатором.

Индексаторы

Общедоступные индексаторы завалены спамом с вирусами и ищут, как правило, плохо, но, тем не менее, подходят для поиска устаревших файлов, загруженных около 5 и более лет назад.
Вот некоторые из них:

  • binsearch.info
  • binzb.com
  • nzbindex.com
  • nzbsearch.net
  • nzbking.com

Бесплатные индексаторы, требующие регистрацию, больше подходят для файлов посвежее. Они хорошо каталогизированы, релизы имеют не только название, но и описание с картинкой.

  • nzbfinder.ws
  • nzbid.org
  • nzbnoob.com
  • nzb.ag
  • nzbfriends.com
  • usenet-crawler.com
  • drunkenslug.com
  • nzbgeek.info

Последние два особенно рекомендую, в них можно найти множество обфусцированных релизов.
Существуют и узконаправленные сайты. Например, индексатор аниме anizb и музыки albumsindex.

Скачивание с Usenet

Давайте попробуем скачать фильм The FP 2011 года, достаточно неизвестный и непопулярный, BDRip’а которого в 1080p так просто найти мне не удалось. Для этого вам нужно найти nzb-файл и импортировать его в программу для закачки, например, NZBGet или SABnzbd, предварительно ее установив.
Заходим на nzbking.com, выполняем поиск по «the.fp.2011».
Поиск the.fp.2011 в nzbking, файл только с одной доступной частью
Видим в индексе файл, у которого доступна только одна часть из 3867. Такой файл не скачать, поэтому индексатор отображает этот параметр красным цветом.

Поиск the.fp.2011 в nzbking, нашелся файл с паролем
Файлы, защищенные паролем, как правило, являются просто фейками.

Поиск the.fp.2011 в nzbking, нашелся DVDRip
На второй странице обнаруживается DVDRip, с адекватным размером, в архиве без пароля — хороший знак.

BDRip the.fp.2011 в nzbking
На третьей странице находим BDRip и несколько DVDRip’ов, похожих на настоящие (судя по размеру файла и дате загрузки).
Выбираем файлы, которые хотим скачать, нажимаем кнопку «Download NZB», скачиваем .nzb-файл и импортируем его в NZBGet или SABnzbd, предварительно вписав данные своего Usenet-аккаунта в настройки программы. Начинается скачивание со скоростью канала моего провайдера.

Скачивание файла через NZBGet
По окончанию скачивания, NZBGet автоматически распакует архивы и удалит их. Файл размером 6.74 ГБ, загруженный 4.5 года назад, скачался за 15 минут!

IRC / DCC / XDCC

Internet Relay Chat — протокол текстового общения, до сих пор пользующийся популярностью у разработчиков свободного ПО, администраторов торрент-трекеров, анимешников и авторов ботнетов из-за своей простоты. Появившийся в 1989 году, IRC стал стандартом групповых чатов в интернете на долгие годы, и начинает терять популярность только к середине 2000-х, с приходом ICQ и Jabber. В IRC существует возможность передачи файлов — DCC, на основе которой в 1994 году был написан первый бот для автоматического распространения доступных боту файлов — Xabi DCC (отсюда и название — XDCC).

На сегодняшний день существуют как отдельные каналы, так и целые серверы, посвященные файлообмену через XDCC. Почти у любой мало-мальски серьезной аниме релиз-группы, у которой даже может не быть веб-сайта, есть свой бот, с которого можно скачать все релизы группы независимо от их возраста. Популярность XDCC обусловлена функциональностью скриптов, легкостью их настройки и администрирования: выкладывающему релиз достаточно загрузить каким-либо образом файл на сервер с ботом, например по FTP, а бот сам добавит его в индекс, оповестит пользователей на канале о появлении нового файла, автоматически отправит его пользователям, подписавшимся на обновления этого бота (например, если это новый эпизод сериала).

В специальных IRC-сетях распространяют варез, свежие и не очень фильмы, музыку, игры, книги. XDCC не наделен вниманием правообладателей, поэтому у ботов можно найти множество вещей, которые сложно найти в других местах.

Индексаторы

Многие (но не все) XDCC-боты индексируются специальными скриптами, предоставляющими веб-интерфейс для эффективного поиска файлов.
Общие индексаторы контента:

  • ixirc.com
  • xdcc.eu
  • sunxdcc.com
  • cr4wl.ga

Индексаторы аниме:

  • news.kae.re
  • nibl.co.uk
  • intel.haruhichan.com

Скачивание из IRC

Вам потребуется IRC-клиент, подойдет практически любой (подавляющее большинство клиентов поддерживает DCC). Подключаемся к интересующему вас серверу из списка, заходим на канал. Крупнейшие серверы с книгами:

  • irc.undernet.org, канал #bookz
  • irc.irchighway.net, канал #ebooks

Варезом:

  • irc.criten.net, канал #elitewarez
  • irc.infatech.net, канал #elitewarez
  • irc.scenep2p.net, канал #the.source

Фильмами:

  • irc.abjects.net, канал #moviegods
  • irc.abjects.net, канал #beast-xdcc

Мультфильмами и аниме:

  • irc.rizon.net, канал #news
  • irc.xertion.org, канал #cartoon-world

Все версии ботов принимают команду !find или @find для поиска файлов, после чего отправляют результаты личным сообщением. Для популярных запросов на каналах с большим количеством ботов вас буквально заспамит ответами, поэтому, если канал поддерживает команду @search, лучше воспользоваться ей — специальный индексатор канала отправит вам результаты одним файлом через DCC.

Попробуем скачать «How Music Got Free» («Как музыка стала свободной» по-русски) — замечательная книга об истории музыкальной индустрии, технологиях обмена музыкой и человеке, который почти в одиночку стащил 2000 альбомов и выложил их в сеть.
Поиск книги на IRC-канале

Бот присылает результат поиска в виде ZIP-архива с текстовым файлом:
Прием ZIP-архива

Отправляем боту запрос на скачивание файла:
Запрос на скачивание файла

…и принимаем его!
Прием файла

Конечно, не обязательно искать напрямую на канале. Если вы нашли нужный файл через индексатор, можете сразу запросить его у бота командой, которую вам сгенерирует сайт.

DC++

Direct Connect-сеть представляет собой клиент-серверную архитектуру, где все коммуникации, кроме непосредственно обмена файлами, происходят через сервер. В DC++ есть возможность расшаривания файлов и директорий, поиск файлов с учетом их типа (видео, аудио, архивы, документы, образы дисков), ссылки на файлы, независящие от имени файла и, конечно же, чат, из-за чего DC++-хабы были очень популярны в локальных сетях интернет-провайдеров РФ. Сибирский провайдер GoodLine рекламировал свой внутрисетевой хаб на уличных рекламных щитах, писал ПО для упрощения файлообмена и даже встраивал его в свои Set-top box, чтобы клиенты могли смотреть новинки кинематографа прямо с телевизора. На хабе сидело более 100000 человек — больше, чем в любом другом хабе в мире.

EiskaltDC++, хаб allavtovo

Из-за того, что пользователю достаточно указать путь к файлам, к которым он хочет открыть публичный доступ, в DC++ можно найти жуткое, малоизвестное старьё, которое, по мнению пользователя с этим файлом, уж точно никому не сдалось, но он его все равно расшарил, так, на всякий случай.

Поиск в DC++
3 человека раздают видеоурок 11-летней давности, который ни одному вменяемому человеку смотреть не захочется, поверьте.

Скачивание из DC++

Вам потребуется какой-нибудь DC-клиент. Под Windows рекомендую FlylinkDC++ (который, к тому же, поддерживает BitTorrent), под Linux — EiskaltDC++ и AirDC++ Web. Далее нужно подключиться к популярным хабам, лучше сразу к десятку. Список хабов есть в самих программах, но можно воспользоваться специальной страницей и скопировать адреса оттуда.

Настоятельно рекомендую включить «активный» режим, пробросить порты, ввести ваш внешний IP-адрес в настройках программы и удостовериться, что к вам возможны подключения извне, иначе, в «пассивном» режиме у вас будут ограничения на количество результатов поиска, вы не сможете качать файлы с других пользователей в «пассивном» режиме.

Страница настроек EiskaltDC++

Поиск и скачивание файлов интуитивно понятно: вводите название, опционально выбираете тип контента и фильтр по размеру, нажимаете кнопку поиска, кликаете два раза по результату, файл начинает скачиваться. Также можно посмотреть все файлы пользователя (и, например, скачать папку с найденным файлом целиком), нажав правой кнопкой по конкретному результату и выбрав соответствующий пункт меню.

Скачивание файла в DC++

Если нужного вам файла не нашлось, имеет смысл периодически повторять поиск. Некоторые люди запускают DC-клиент только тогда, когда им нужно что-то скачать, и вам нужно поймать момент, чтобы найти файл у таких пользователей.

Из-за ограничений протокла NMDC, одновременный поиск нескольких файлов затруднен, результаты одного поискового запроса могут перемешиваться и отображаться в соседних окнах поиска, поэтому лучше не искать несколько файлов одновременно. У хабов, работающих по протоколу ADC, таких ограничений нет, но и таких хабов удручающе мало (их URI начинается с adc://, а не с dchub://).

Индексаторы

Поиск внутри программы может найти только файлы пользователей, находящихся в DC-сети на момент поиска, поэтому индексаторы очень полезны для нахождения и скачивания файлов с редко запускающих программу людей.

Насколько мне известно, полноценный индексатор DC++ есть только один — spacelib.dlinkddns.com (и его второй адрес dcpoisk.no-ip.org). Поиск основан на движке Sphinx и учитывает морфологию (в том числе и русского языка). Поисковик генерирует magnet-ссылки для результатов поиска, которые можно поставить на закачку в клиенте.
Иногда он подолгу недоступен, например, в прошлый раз он не работал два месяца подряд.

eDonkey2000 (ed2k), Kad

ed2k — протокол децентрализованной передачи файлов, требующий сервер-хаб для нахождения пользователей и соединения с ними. Был протоколом №1 для передачи файлов среди всех слоев населения, до закрытия самого популярного сервера Razorback 2 в 2006 году и роста популярности BitTorrent.

eDonkey2000 выжил. Этому поспособствовал протокол полностью децентрализованного обмена Kad, который был внедрен в сторонние клиенты незадолго до закрытия Razorback 2 и главного сервера оригинальной программы, уступающей в функциональности и скорости альтернативным реализациям.

В ed2k можно найти примерно то же самое, что и в DC++ — старые файлы, ТВ-шоу на разных языках, разнообразную музыку, игры, варез, старые книги по программированию, математике, биологии. Новинки, разумеется, тоже в наличии. Хоть протокол и поддерживает чаты и просмотр всех файлов пользователя в открытом доступе, эти функции по умолчанию отключены, и, скорее всего, вам не удастся пообщаться с интересующими вас людьми через программу.

Скачивание в eDonkey2000 / Kad

Как вы уже догадались, потребуется ed2k-клиент. Хороший выбор для Linux — aMule, для Windows, наверное, eMule, хоть он и не обновлялся с 2011 (Обновление: появилась официальная версия eMule от сообщества, доступная для скачивания на официальном сайте, она обновляется). Крайне рекомендую пробросить порты, чтобы иметь возможность скачивать с пользователей за NAT (LowID).

Процесс поиска и скачивания файлов очень похож на таковой в DC++ — вводим поисковой запрос, получаем результаты поиска с пользователей, находящихся онлайн, кликаем на файлы для начала скачивания.
Файл отобразится в результатах даже в том случае, у пользователей, находящихся онлайн, есть только его части, но не файл целиком.

Попробуем найти малоизвестный документальный фильм 2009 года We Live In Public — картину, повествующую о событиях 90-х, которые частично предсказали современный интернет. Часть времени в фильме уделяется сайту pseudo.com — сервису аудио- и видеотрансляций, основанном в 1993 году.

Вводим поисковую фразу, получаем результаты:
Поиск фильма We Live In Public в ed2k

Кликаем, начинается скачивание:
Скачивание фильма We Live In Public в ed2k

Загрузка файла может растянуться на недели и месяцы. По какой-то причине, многие пользователи сети имеют отвратительное интернет-соединение, да еще и появляются раз в неделю на пару часов, а то и меньше.

Soulseek

Soulseek — централизованная сеть обмена музыкальным файлами по принципу P2P, созданная в 2000 году одним из разработчиков Napster. Долгое время была популярна среди слушателей и авторов IDM и прочей электронной музыки, и по сей день сеть развивается и остается хорошим местом для поиска аудиофайлов. Есть групповые и приватные чаты, возможность раздачи файлов только друзьям, удобный поиск музыки с указанием битрейта и других характеристик аудиофайлов. Некоторые поисковые запросы цензурируются.

Существует официальный кроссплатформенный проприетарный клиент SoulseekQt и два развивающихся неофициальных: Nicotine+ и Museek+.

BitTorrent DHT

Все популярные клиенты BitTorrent могут искать пиров и обмениваться торрент-файлами через распределенную хеш-таблицу (DHT). Этим пользуются не только компании, отслеживающие раздающих файл пользователей, по договору с правообладателями контента, но и индексаторы, которые пытаются получить torrent-файл с infohash из DHT-запроса и сохранить его в своей базе. Индексаторы могут найти нигде не опубликованный или просто редкий торрент по названию директории или файла, а также различные дубликаты интересующего вас торрента с потенциальными сидерами.
Ранее самым популярным индексатором был ныне неработающий btdigg, на смену ему, с некоторым запозданием, пришли следующие сайты:

  • bitsnoop.com
  • godht.com
  • btdb.in
  • digbt.org
  • btdb.in
  • btkitty.bid
  • kikibt.net
  • btdig.com (не имеет отношения к оригинальному btdigg, хоть и страница в wikipedia говорит об обратном)

К сожалению, подобные сервисы не живут долго: два моих любимых, fastbot и BTKitty.red, не открывались на момент написания статьи.

Файлообменники и FTP-серверы

Почти в каждом регионе существуют свои местные файлообменники, пользующиеся популярностью у конкретной языковой группы. Например, на uloz.to можно найти много чешского и словацкого контента, zone-telechargement.ws подойдет любителям французского языка, а chomikuj.pl для поляков.

Индексаторы FTP-серверов нечасто находят нужные файлы, но попытаться стоит:

  • mmnt.net
  • searchftps.net
  • filemare.com
  • ftpsearch.lostclus.kiev.ua
  • filewatcher.com
  • krasfs.ru
  • ftplike.com

Поисковики по популярным файлообменникам тоже существуют, но не всегда эффективны:

  • filediva.com
  • rapid-search-engine.com
  • alluc.ee

До совсем недавнего времени большое количество контента можно было найти на ex.ua, но увы.


Как искать

Не всегда достаточно искать файлы только по названию материала, так можно упустить сценические релизы.

Рели́зная гру́ппа — сообщество людей-энтузиастов, объединенных идеей свободы информации. Выпускает электронные копии CD или DVD с фильмами, музыкой, программами и играми для компьютеров и игровых приставок, руководствуясь правилами релизов и соревнуясь со своими коллегами-конкурентами в скорости и качестве выпуска таких копий (релизов). Сообщество релизных групп, объединенных одной темой (музыка определенного жанра, кинофильмы или варез), называется сценой.

https://ru.wikipedia.org/wiki/Релизная_группа
Сценические релизы очень часто содержат сокращенные или намеренно испорченные имена архивов, которые нельзя найти обычным поиском по имени файла. Чтобы узнать настоящее имя, нужно поискать его в специальных индексаторах сцен-релизов: layer13.net, pre.corrupt-net.org и predb.me.

Попробуем узнать сценическое название архивов с релизом We Live In Public от PUZZLE на Layer13:

We Live In Public на Layer13

NFO-файл называется «puzzle-wlip.nfo». Названия архивов практически всегда, в 99% случаев совпадают с названием NFO, поэтому попробуем поискать это название в Usenet-индексаторе:
Поиск по сценическому имени архива в Usenet

Ура, теперь мы можем скачать DVD фильма!

Обычные поисковые системы вроде Google не всегда будут вам помощниками. Во-первых, Google следует букве закона и удаляет (скрывает) результаты с сайтов, о которых сообщают ему правообладатели в рамках DMCA, во-вторых, поиск контента с названием из спецсимволов затруднен: проблемно найти что-либо о W.I.T.C.H., вам постоянно подсовывают информацию о Witch, The Witch или Blair Witch. Я предпочитаю пользоваться DuckDuckGo, Bing и метапоисковиком SearX — через них можно найти материалы, недоступные в Google.
Если вас интересует релиз на конкретном языке, уместней узнать локализованное название и совершать поиск по нему. Получить подобную информацию можно на Wikipedia, IMDb и других подобных сайтах.

Для аниме есть anidb, хранящий информацию о релизах групп на разных языках. Карточка группы, как правило, содержит ссылку на сайт или IRC-канал, где можно пообщаться с ее членами и скачать файлы через XDCC.
Информация о группах на Anidb

Помимо источника, разрешения видео, языков аудиодорожек и субтитров, на anidb есть TTH-хеш для DC++ и ed2k-ссылка для каждого файла.
Информация о файле на anidb

Заключение

Примерно так я ищу нужные мне файлы. В посте намеренно не упомянуты очевидные вещи, вроде покупки дисков с Amazon или Ebay и поиска по популярным открытым и закрытым Torrent-трекерам. Все способы применимы для медиаконтента из Европы и США, мне никогда не приходилось искать, например, арабский и индийский контент, поэтому не могу сказать, насколько они эффективны.

Скрытый текст

А еще Usenet можно использовать для дешевого хранения резервных копий: шифруем файлы, покупаем доступ в Usenet за $10, загружаем файлы, через 4 года опять покупаем доступ и скачиваем их за еще одни $10. В отличие от облаков, в Usenet не нужно оплачивать хранение файлов. Но без фанатизма, а то удалят.

Добавить комментарий