I want to scan some WordPress websites and need to find some target websites.
For that, I need to find URLs that contains some exact text and i just know this could be done by google (cuz i used it before but i cant remember how).
For this case, I want to find wp sites, That would be done by searching for urls that containes “wp-admin.php”. something like this :
urls contains (“wp-admin.php”)
I’ve googled for it but nothing found.
Any help would be appreciated.
Thanks in advance.
asked Aug 21, 2018 at 17:45
1
You can use the following solution to find web pages by part of he URL in Google:
allinurl:wp-login.php
Grant Miller
27k16 gold badges142 silver badges163 bronze badges
answered Aug 21, 2018 at 18:57
1
На сайте с 08.03.2007
Offline
238
MIND
6 мая 2008, 20:21
5925
Все никак не могу найти способ найти сайт по части урл, содержащегося на многих его страницах. Какие ПС (и их операторы) или сервисы могут помочь? :smoke:
UPDATED: проблема решена, спасибо
Key Collector – автоматизированная система анализа семантического ядра (/ru/forum/863504)
- eTarget 2011:Панельная дискуссия «Стратегия и планирование рекламной кампании в интернете»
- eTarget 2011: Круглый стол «Реклама в онлайн-видео»
- Могут ли «плохие» входящие ссылки привести к ухудшению ранжирования?
На сайте с 22.11.2006
Offline
277
tommy-gung
6 мая 2008, 20:37
#1
google.com 😉
Здесь не могла быть ваша реклама
На сайте с 08.03.2007
Offline
238
MIND
6 мая 2008, 20:41
#2
Так синтаксис запроса каким должен быть? 🙂
На сайте с 25.11.2007
Offline
59
ArtyShocK
6 мая 2008, 20:41
#3
в гугле inurl: и искомая часть)
портфолио (http://www.free-lance.ru/users/ArtyShocK)
icq 350015776
На сайте с 08.03.2007
Offline
238
MIND
6 мая 2008, 20:48
#4
такое сегодня уже пробовал 🙂 не получается 🙁 Он кусок динамического урла отфильтрует?
UPDATED: проблема решена, спасибо 🙂
S
На сайте с 25.11.2007
Offline
143
sapien
6 мая 2008, 21:46
#5
гугл банит быстро сцуко
вот еще для других пс http://www.shtogrin.com/library/search_engines/advansed_search/
Как получить нужную часть url без location.search
? Например ?article=new
из http://site/index.php?article=new
. У меня такой код но получаю article=new
без ?
. Как получить ?article=new
var href = window.location.href;
var index = href.split('?');
var url = index[0];
Получаю article=new
$('body').on('click', 'a', function (e) {
e.preventDefault();
var url = this.href;
var get = location.search;
});
А так ничего не получается
задан 12 дек 2015 в 15:19
Узбек БахаУзбек Баха
2,5484 золотых знака20 серебряных знаков44 бронзовых знака
var url = new URL('http://site/index.php?article=new');
var search = url.search; // ?article=new
А не работает ваш код, потому что в контексте вашего обработчика, this
указывает на элемент body
, а вовсе не объект Window
. Вместо this
, вам нужно было использовать внутри обработчика запрос $(window)
:
$('body').on('click', 'a', function (e) {
e.preventDefault();
var location = $(window)[0].location;
var url = location.href;
var get = location.search;
});
ответ дан 12 дек 2015 в 23:36
0
var s = "http://site/index.php?article=new";
var path = "?" + s.split("?")[1] // "?article=new"
ответ дан 12 дек 2015 в 15:24
StackStack
9,43522 серебряных знака62 бронзовых знака
С помощью оператора “site:” можно указывать определённые пути сайта.
Помните, что это работает только для путей URL следующих непосредственно после доменного имени. Итак, как искать по тексту в других частях URL?
Поиск по «папкам» сайта
tesla announcements inurl:2018
К счастью, у Google есть оператор “inurl:”, который позволяет искать по части адреса страницы.
Помните, что текст, который вы указываете в “inurl:”, может появиться где угодно в URL, а не только на уровне папки.
Поиск по определённому диапазону дат
tesla announcements daterange:2458272-2458302
Если вы хотите сузить поиск до конкретного диапазона дат, то для этого есть оператор “daterange:”, который, в теории, позволяет указать даты публикации.
К сожалению, в обычных органических результатах даты публикации не всегда точные, и на практике “daterange:” возвращает довольно странные результаты. Ещё вы могли обратить внимание, что используется довольно странный формат даты. Оператор “daterange:” используют Юлианский формат даты.
Поиск по широкому диапазону дат
tesla announcement 2015..2017
Если вам не нужна особая точность в диапазоне дат, используйте оператор диапазона .. (двоеточие) с годами. Годы, как правило, достаточно уникальны, чтобы результаты были довольно релевантными.
Обратите внимание, что это не специальный поиск по дате, это что-то вроде хитрости. К сожалению, оператор диапазона не всегда правильно работает в паре с “inurl:” и другими продвинутыми операторами.
Поиск по файлам определённого типа
“информационная безопасность” filetype:pdf
Оператор “filetype:” позволяет указать расширение файла, например, PDF. В предыдущем примере нас интересуют поиск PDF файлов, содержащие точную фразу “информационная безопасность”.
Оператор “filetype:” позволяет указывать различные типы файлов. Вы можете также попробовать “doc”, “docx”, “rtf” (Word), “xls”, “xlsx” (Excel), “ppt”, “pptx” (PowerPoint), и “txt” (текстовые файлы). Ещё можно использовать “filetype:” для указания определённых вариантов веб-страниц, включая “html”, “htm”, “php”, “asp” и т.д. Имейте в виду, что расширение файла обычно должно указываться в URL-адресе, поэтому эти запросы не являются исчерпывающими.
Поиск ссылок – оператор “link:”
С 2017 оператор “link:” является устаревшим. Теперь Google трактует “link” как слово для поиска и просто ищет совпадения.
Поиск внутри текста анкора
inanchor:”tesla announcements”
Вы можете использовать оператор “inanchor:” для поиска внутри текста ссылки. Например, приведённый выше поисковый запрос ищет сайты, на которые дана ссылка с сайтов с использованием фразы “tesla announcements” в тексте ссылки.
Помните, что оператор “inanchor:” представляет только небольшую выборку индекса и больше активно не поддерживается Google.
Поиск нескольких слов в тексте анкора
allinanchor: tesla announcements “model x”
Как и все другие вариации “allin…”, “allinanchor:” применяется к каждому слову после него, выполняя поиск всех этих слов в тексте анкора, но не как точное соответствие.
Операторы для поиска по анкорам (“inanchor:”, “allinanchor:”) могут быть полезны для ваших начальных исследований, но не ждите от них полной, точной репрезентативности всех ссылок на ваш сайт или на сайты ваших конкурентов.
Фильтрация субдомена “www”
site:offensive-security.com -inurl:www
Для углубления в индекс сайта, комбинация “site:” с “inurl:” быстро станут вашими лучшими друзьями. Например, может быть вы ходите увидеть страницы, которые не входят в субдомен “www”. Вы можете использовать “site:” вместе с негативным совпадением оператора “inurl:”:
Если в качестве канонического имени (то, как адрес выглядит по умолчанию) выбрана версия с www, то вы быстро увидите новые субдомены (если они есть). Это может послужить хорошей отправной точкой для последующего углубления в изучение структуры сайта.
site:fsb.ru -inurl:www
Отфильтровка нескольких субдоменов
site:amazon.com -inurl:www -inurl:logistics -inurl:developer -inurl:kdp
Вы можете довольно сильно расширить эту концепцию, последовательно ограничивая поиска исключая всё новые домены.
Можно использовать десятки выражений с “inurl:” – неизвестно, есть ли какие-либо ограничение на их количество, но большинству сайтов в любом случае не потребуется так много. Просто помните об этом на тот случай, если вам это понадобится.
Поиск по одному субдомену
site:cooi.fsb.ru
Вы можете сфокусироваться на одном субдомене. Для поиска по одному поддомену предпочтительнее использовать оператор “site:”. Посколкьу использование “site:” может найти текст в любом месте URL.
Вы можете расширить эту концепцию, ища одновременно и по субдоменам и по папкам.
site:en.kali.tools/all
Фильтр небезопасных страниц
site:amazon.com -inurl:https
Что интересно, вы можете использовать “inurl:” для включения или исключения из результатов безопасных (https:) страниц.
Если вы переводите сайт с “http:” на “https:” эта хитрость может вам помочь убедиться, что новые страницы проиндексированы должным образом и старые страницы постепенно исчезают из индекса.
Поиск по URL параметру
site:amazon.com inurl:field-keywords
Вы можете использовать “inurl:” чтобы нацелиться на URL параметр динамической страницы.
Помните, что нет способа указать именно URL параметр – Google может найти текст в любой части URL. Но хорошая новость в том, что параметрам свойственно иметь уникальные имена.
Поиск по нескольким URL атрибутам
allinurl: amazon field-keywords nikon
Так же как “allintitle:” и “allintext:” имеется оператор “allinurl:”. В этом примере вы ищите внутренние страницы поиска на Amazon, которые имеют слово “Nikon” в URL:
К сожалению “allinurl:” страдает от двух проблем. Одна в том, что вы не можете надёжно совместить его с “site:”, что ограничивает ваши опции. Вторая – он склонен возвращать странные результаты. В большинстве случаев рекомендуется вместо него использовать несколько “inurl:”.
Поиск заблудившихся текстовых файлов
site:yandex.ru filetype:txt -inurl:robots.txt
Вас может посетить мысль, а не забыли ли вы где-нибудь на сайте файлы документов, которые могла подобрать Google. Вы можете проверить это используя комбинацию “site:” и “filetype:”.
В примере исключён из результатов выдачи файл “robots.txt” (используя “-inurl:”).
Это комбо хороший способ зачистить файлы, которые случайно были оставлены на сайте.
Поиск страниц-дублей на сайте
site:amazon.com “hot wheels 20 car gift pack”
Используя оператор “site:” с точно совпадающей фразой вы можете найти дублирующие или очень похожие страницы.
Ищем дублирующие заголовки
site:amazon.com intitle:”hot wheels 20 car gift pack”
Используя “site:” плюс “intitle:” вы можете найти страницы на сайте, которые могут быть полными дубликатами.
Поиск дубликатов с исключением
site:amazon.com intitle:”hot wheels 20 car gift pack” -inurl:review -inurl:reviews
При поиске вы можете группировать разные операторы – достигая нужного уровня точности.
Поиск домена в других доменных зонах
site:hackware.* -site:hackware.ru
Это простой и быстрый способ найти зарегистрированные доменные имена в других доменных зонах (доменах верхнего уровня).
Информация о странице
info:yandex.ru
С помощью info: вы можете получить краткую информацию о странице. Для большинства сайтов просто показывается случайная цитата с интересующей страницы и её заголовок.
Поиск кешированной версии сайта
cache:hackware.ru/?p=21
Это не совсем поиск, команда cache: – это возможность посмотреть кэшированную версию сайта. Т.е. если сайт изменился за последнее время, в кэше могла сохраниться его предыдущая версия.
А у меня пока что все, подписывайтесь, ставьте лайки и ждите новый контент.
Как узнать полную ссылку, зная часть адреса этой ссылки?
Мастер
(2262),
на голосовании
8 лет назад
Голосование за лучший ответ
Дмитрий Канидьев
Оракул
(74006)
8 лет назад
а зачем нужны программы, если можно для этих же целей использовать поисковики? учи язык поисковых запросов – и будет тебе счастье…
ЧужакМастер (2262)
8 лет назад
Вот примерно что мне делать, если я ищу фотки, загруженные в конкретное время конкретным человеком в контакт, если я знаю адреса нескольких из них? Я посмотрел, они загружены в одно и то же время, сначала в один альбом, потом разбросаны по разным, адреса не поменялись, имеют вид h t t p://cs(******).vk.me/v(*********)/****/***********.jpg (скобками помечена совпадающая часть, поставил пробелы от антиспам системы)