Как найти стоп слова в тексте

Вопросы, рассмотренные в материале:

  • Что такое стоп-слова в тексте

  • Какие бывают стоп-слова и выражения

  • Почему поисковые роботы игнорируют стоп-слова

  • Каким должен быть хороший текст для людей и роботов

  • Как проверить текст на наличие стоп-слов

Не каждый может написать действительно хороший текст, хотя писателей и копирайтеров сейчас очень много. Большая часть статей, написанных частными исполнителями, – малосодержательна. В них минимум полезной информации. Стоп-слова в тексте делают статью неинтересной, неудобной для восприятия. Это отталкивает читателя, и человек, зайдя на страницу, почти сразу ее покидает.

Что такое стоп-слова в тексте

Стоп-слова

Существует категория слов, удаление которых из текста не только не нарушает его смысла, а, даже наоборот, делает более понятным, простым для восприятия. Их и называют стоп-словами.

Американский профессор Уильям Странк-мл. в своей небольшой книге «Элементы стиля» (1920 г., США) перечислил правила, помогающие писать доступно и интересно. Одной из распространенных ошибок при этом профессор называет использование лишних слов.

Динамичный текст должен быть емким – эту мысль еще тогда первым высказал Уильям Странк. Лишние слова портят предложение, а лишние предложения перегружают абзац, так же, как на картине не нужны лишние мазки, а лишние детали помешают работе механизма.

Это не призыв сокращать каждое предложение до минимума, упускать важные подробности и давать описания в общих чертах. Это рекомендация не использовать стоп-слова в тексте, они не несут смысловой нагрузки и только мешают восприятию.

Подобные рекомендации есть в книге редактора и переводчика Норы Галь «Слово живое и мертвое», вышедшей в СССР (1972 г.). Автор призывает не использовать канцеляризмы, отглагольные существительные (вместо глаголов), излагать просто, без излишней официальности, меньше использовать слов иностранного происхождения, больше русских и стараться быстро ухватить самую суть.

Данное направление получило развитие, в этом заслуга передовых журналистов, лингвистов и людей, умеющих писать и чувствующих слово. Сформировались новые рекомендации для тех, кто занимается написанием текстов и статей. Лишние «мусорные» слова были классифицированы.

Стоп-слова

В наши дни тема приобрела еще большую актуальность, стремительно развивается Интернет, появляются новые стили письма. «Стоп-слова» – это уже почти официальная терминология, которой обозначаются те отрывки, которым можно не придавать значения.

Сейчас уже существуют алгоритмы, придуманные специально для того, чтобы подсчитывать стоп-слова в тексте. Сформировались новые термины: «переспам», «тошнота», «водность» и пр. Определение «стоп-слово» применяется теперь к целым фразам, а не только к отдельным словам.

Ни в одном из существующих языков стоп-слова не являются запрещенными для использования, авторы могут применять их по своему усмотрению. Но, как правило, текст, не наполненный стоп-словами, воспринимается намного лучше.

Задача редактора – определить, насколько полезно использование стоп-слова в каждом конкретном случае. Слова, не несущие смысловой нагрузки, редактор удаляет, а те, что имеют значение для текста, оставляет.

Простые примеры стоп-слов в тексте

Текст с лишними словами Просто текст

Мороз стоял сильный, следовательно, уроки в школе отменили.

Из-за мороза уроки в школе отменили.

Из всех проживающих в Англии этот самый богатый человек в тот день был самым несчастным среди других.

Богатейший человек Англии в тот день был самым несчастным.

Естественно, я убедился, что ваша прекрасная внешность действительно соответствует всем вашим душевным качествам.

Я убедился, что душа ваша так же прекрасна, как и внешность.

Я, несомненно, кое-что знаю о настоящих причинах того большого внимания, которым он постоянно окутывает вас.

Я знаю, почему он к вам так внимателен.

Разумеется, примеров, которые дают полное представление о том, что такое стоп-слова, на самом деле, можно привести очень много.

Есть много примеров, где стоп-слова в тексте встречаются слишком часто.

Какие бывают стоп-слова в обычном тексте: 14 категорий

На сегодняшний день лингвисты, отвечая на вопрос «Что это такое стоп-слова в тексте?», включают в это понятие более 2000 слов. Для простоты использования их сгруппировали в 14 категорий.

  • Междометия: ах, ух, ну, уж, ой.

  • Местоимения: я, мы, мой, вы, ваш.

  • Неопределенность: где-то, что-то, зачем-то, как-то, какой-то, около, порядка, примерно, всего.

  • Вводные структуры: на самом деле, допустим, скажем, например, в общем.

  • Слова-усилители: предельно, максимально, наиболее, очень, самый, абсолютно, сильно.

  • Оценочные: роскошный, уютный, красивый, дорогой (не следует сочетать их со словами из предыдущего пункта).

  • Очевидные формулировки: данный документ, этот сайт, на данной странице, кликните эту кнопку, нажмите тут, форма внизу страницы.

  • Бытовые штампы: направо и налево, сплошь и рядом, шаг за шагом, так или иначе, мало-помалу.

  • Штампы, характерные для прессы: ударными темпами, пески времени, царила атмосфера, в лучших традициях.

  • Штампы корпоративного или рекламного характера: индивидуальный подход, решать бизнес-задачи, завоевать доверие клиентов, расширить географию продаж.

  • «Временные» слова-паразиты: в наши дни, в настоящее время, в современном мире.

  • Словосочетания с отглагольными существительными: оказывать услуги по ремонту, производить ремонт, осуществлять деятельность.

  • Модальные фразы: нужно пройти процедуру, можете авторизоваться, должны завершить заказ.

  • Страдательные глаголы и сказуемые в безличных предложениях: спорткомплекс построен по заказу мэрии, леса вырубают.

Кто-то скажет, что список слишком большой (в особенности его вторая половина). Здесь не имеется в виду, что стоп-слова в тексте – это плохие и недопустимые слова. Важно научиться использовать их обдуманно, наделить каждое смысловой нагрузкой.

Еще 7 видов стоп-слов, которые портят текст

Опытные журналисты и авторы статей для Интернета не останавливаются на том, чтобы использовать как можно меньше «мусорных» слов. Они подходят к делу серьезнее.

Важный момент – простота текста, при этом смысл не должен теряться. Не следует путать простоту с примитивностью. Текст может нести серьезную смысловую нагрузку, освещать сложные понятия и термины. При этом нет причин выражать суть слишком сложно, если можно сделать это проще.

Упростить – не означает бездумно выбросить куски текста. В первую очередь это суметь найти стоп-слова в тексте и избавиться от них. Текст станет чище, однако не потеряет от этого смысловую насыщенность.

Стоп-слова, которые портят текст

  1. Вводные конструкции

  2. Одна из самых простых групп стоп-слов. Их просто заметить и удалить из текста.

    Словосочетания вида «не секрет» или «всем известно» заманчивы для использования, но ни к чему писать лишний раз, что факт широко известен, если об этом и так все знают.

    Хорошо, если в тексте есть примеры, но слова «например» нужно стараться избегать.

    Пришли вы в магазин. Например, за молоком.

    Вот пришли вы в магазин за хлебом.

    Еще один пример стоп-слова в тексте – «кстати». Не нужно специально подчеркивать, если что-то пришлось кстати, это и само по себе понятно.

    Вечером перед сном не следует есть что-то жирное и калорийное. Кстати, калорийность нашего йогурта всего 1,5 кКал.

    В нашем йогурте полторы килокалории, поэтому его можно есть вечером перед сном.

  3. Оценки

  4. Лучшая оценка, это та, которую человек может сделать, опираясь на собственный опыт. Если дальний знакомый будет уверять вас в том, что его друг успешный бизнесмен, вряд ли вам удастся ясно представить себе этого друга. Скорее всего, вы не сможете сравнить его успехи со своими собственными, подумать о сотрудничестве с ним. Заверения малознакомого человека для вас мало значат.

    Кейс: VT-metall

    Узнай как мы снизили стоимость привлечения заявки в 13 раз для металлообрабатывающей компании в Москве

    Узнать как

    Текст, содержащий оценочные суждения автора, получается пустым. Оценка будет восприниматься убедительно, если подкрепить ее реальными фактами или вовсе заменить. Автор должен проделать большую работу, вникнуть в тему, разобраться с техническими терминами, изучить данные статистики, пообщаться с производителями и т. д.

    Мгновенная загрузка компьютера.

    Использование твердотельного жесткого диска гарантирует загрузку компьютера в течение трех секунд.

    Полезное лакомство.

    Зерновые хлопья с фруктовой начинкой, обогащенные кальцием и витаминами.

    Высокая процентная ставка, удобное обслуживание.

    21,5 % годовых в рублях; возможность доставки карты на дом заказчику.

  5. Штампы

  6. Слова-паразиты

    Еще одна разновидность стоп-слова в тексте – штамп. Это широко известное и часто используемое сочетание слов, которое не очень понятно по смыслу, или его можно заменить одним словом.

    Одна из разновидностей штампов – корпоративные штампы. Они так же не нужны в тексте, как и оценки. Вместо них приведите конкретные факты или полезные сведения.

    Нам доверяют самые крупные компании на рынке.

    Разработанные нами системы используются для защиты нефтеперерабатывающих заводов «Газпром нефти» и центрального офиса Сбербанка.

  7. Заумные слова

  8. С уверенностью можно сказать, что это тоже стоп-слова в тексте. Чем проще у вас получается изложить суть, тем лучше. Текст воспринимается легко, если в нем используются простые слова.

    Кадровый аппарат ведомства продемонстрировал положительную тенденцию в области производительности труда.

    Работа сотрудников отдела улучшилась.

    Не стоит смешивать понятия «заумные слова» и «термины». Если очевидно, что без сложного слова не обойтись и оно точно подходит по значению, то его не нужно убирать.

    Заумно

    Термин по делу

    Доминантная тема мероприятия — права человека.

    Примеры доминантных генетических признаков человека – веснушки и ямочки.

  9. Отглагольные слова

  10. Чтение текста вызывает в голове у читателя визуальную картинку. Она получается интересной и динамичной, если текст наполнен действием.

    Обычно это выражают при помощи глаголов. Но случается, что автор передает действие завуалированно, проявляя некую нерешительность. Действие есть, но оно спрятано за отглагольными существительными, которые тоже считаются стоп-словами в тексте.

    Они занимаются производством фильмов и видеороликов.

    Они снимают фильмы и видеоролики.

  11. Неопределенные слова

  12. Текст, который легко себе представить, всегда интересен для чтения, в голове как будто прокручивается кино. Неопределенные слова – это стоп-слова в тексте, которые не несут конкретной информации и не поддаются представлению.

    К берегам Норвегии переместили более восьми нефтяных вышек.

    К берегам Норвегии переместили девять нефтяных вышек.

    Нашей разработкой пользуются более 20 000 клиентов.

    У нас 20 тысяч пользователей.

    Читателю не всегда интересно точное количество клиентов или вышек. Ему достаточно примерной величины, чтобы иметь представление о вопросе.

  13. Брехня

  14. Брехня

    Под брехней подразумеваются туманные формулировки, которые фактически не лживы, но и правдой тоже не являются. Это разновидность стоп-слов в тексте, которую используют для усиления значения шаткой, ничем не подтвержденной мысли.

    Подобные определения очень неубедительны. Они не обязательно появляются от того, что автор умышленно хочет соврать, а просто из-за его лени. Вместо того чтобы разыскать реальные факты, журналист использует общие абстрактные формулировки.

    Неубедительно

    Убедительно

    Генетики делают работу полиции

    Все чаще случается, что полиция не справляется со своей непосредственной работой и генетики выполняют то, что должны делать полицейские. Можно заявить, что главным способом продиагностировать редкие болезни и разыскать по ним людей становятся генетические исследования.

    Версальского вора удалось разыскать по ДНК

    Пять месяцев поиска Версальского вора принесли свои плоды. Преступником оказался брат начальника охраны музея. Его вычислили с помощью генетического анализа частичек кожи, оставленных на стаканчике, из которого вор отпил во время преступления.

Подход поисковых машин в поиске стоп-слов в тексте

Ежедневно в базы поисковиков попадает огромное количество страниц. Для экономии пространства поисковые машины не берут в расчет некоторые слова, не учитывают цифры, одиночные местоимения, часть букв. На них проставляется специальная маркировка, и роботы их «не замечают».

Использование ключевых слов для поиска информации существенно увеличивает список стоп-слов. Появился новый термин «шумовые» слова, введенный в обиход программистами.

Что значит «стоп-слова в тексте» для поискового алгоритма?

Шумовые (те же стоп-слова) – это слова (символика, знаки), которые в отрыве от всего остального текста не имеют никакого смысла. Поисковики «не видят» их в процессе индексации или ранжирования сайтов. Однако без них текст теряет свою целостность и читабельность.

Контент без стоп-слов будет неполноценен, его не смогут нормально воспринимать ни читатели, ни поисковые системы. Стоп-слова в тексте дают возможность органично наполнить его ключевыми фразами, использовать предлоги и знаки препинания для объединения несогласованных между собой слов.

Для каждого поисковика (типа «Яндекса» или «Гугла») составляются свои собственные перечни шумовых слов, которые постоянно обновляются. Перечислить их все не представляется возможным.

Но можно заметить, что существуют две основные группы, на которые делят все стоп-слова: общие и зависимые.

  • Общие: союзы, местоимения, частицы, предлоги, наречия, вводные слова, однозначные числа. Кроме того, распространенные служебные слова, символика, знаки препинания, самостоятельные части речи. Не так давно в этот список вошли часто встречающиеся наборы символов из Интернета, типа www, http, com.

  • Зависимые: те, которые ключевые запросы определяют как слова второстепенного значения.

Стоп-слова в тексте, относящиеся ко второй категории, зависят от фразы, внесенной в поисковик. Смысл в том, чтобы в найденном документе отсутствие обычных слов и зависимых стоп-слов (из фразы запроса) учитывалось по-разному.

Если ввести в строку поисковика «Лев Николаевич Толстой», то, скорее всего, интерес для пользователя будут представлять документы, где есть:

  • Толстой, Лев, Николаевич;

  • Толстой, Лев;

  • Николаевич, Толстой;

  • Толстой.

И нет смысла показывать страницы, где найдется только:

  • Лев, Николаевич;

  • Лев;

  • Николаевич.

Шумовые слова в этом запросе – Лев и Николаевич.

В процессе индексации приведенные выше шумовые слова поисковые роботы убирают из текстов и из ключевых фраз (когда идет определение, подходит ли документ под данный запрос). Программа ставит на их места специальные символы, так называемые маркеры.

Эта процедура снижает нагрузку на сервер, уменьшает размеры индекса, позволяет разумно использовать пространства баз данных. Стоп-слова в тексте запроса удаляют еще и для того, чтобы снизить количество операций по поиску каждой составляющей ключевой фразы. А это, в свою очередь, увеличивает скорость и эффективность поиска необходимых данных и позволяет сохранить релевантность запроса.

Слова в тексте для SEO-продвижения

Стоп-слова для SEO-продвижения

Интересный и важный момент – как стоп-слова влияют на SEO-тексты. При формировании контента серьезное значение имеют такие факторы:

  • каким будет восприятие текста читателями;

  • как будут видеть текст роботы поисковых систем.

Текст, составленный только из слов, несущих смысловую нагрузку, нечитабелен. Людям трудно его воспринимать.

Слишком большое количество стоп-слов в тексте, шумовых отступлений, лишних словосочетаний делает его непригодным для результативного восприятия поисковыми системами.

Цель SEO-продвижения – сбалансировать контекст по информативности и читабельности.

Задача непростая, ведь одна и та же статья представляет интерес для очень разных пользователей. Кто-то хорошо знаком со словом «дилемма» и свободно им пользуется, а для другого человека это непонятный страшный термин. Одни свободно воспринимают в статье слова «контент» и «лендинг», а другие не разберутся, если не написано проще: «содержание страницы» и «сайт-одностраничник».

Поэтому весь контент в Интернете разбит на категории: продающую, информационную, развлекательную и т. д. Для каждой категории правила использования стоп-слов в тексте неодинаковы. На автора ложится ответственность решить, где слово или фраза необходимы, а в каком месте их следует считать шумовыми («лишним мусором»).

Три пользы

Поисковые роботы не принимают в расчет шумовые лексемы при изучении страницы, так как они не содержат смысла. Большое количество «мусорных» слов повышает водность и тошноту текста, а его релевантность падает. Полезной информации в таком контенте мало, он плохо воспринимается пользователями и ухудшает ранжирование сайта.

Однако, если удалить почти все стоп-слова в тексте, он станет странным, неестественным. Такой текст невозможно запросто прочесть. Теряется логичность, а отчасти и смысл написанного. Например, поисковые роботы не умеют распознавать иронию, переносное значение, отрицания. Читатель воспримет такой контент как бессмысленный набор фраз.

Важно суметь создать равновесие между словами, необходимость которых под вопросом, и теми, которые однозначно следует удалить. Распространенная ошибка авторов, работающих в инфостиле – убрать из текста все местоимения. Содержание получается сухим, похожим на телеграмму. Вот пример:

Консультируем по земельным вопросам. Составляем акты на землю. Вносим объект в Госкадастр.

Мы даем консультации по земельным вопросам: продажа земельного участка, оформление прав собственности, раздел, объединение. Наши специалисты проводят замеры для составления акта на землю.

Первый вариант очень короткий, без местоимений и конкретной информации. Второй не назовешь отличным, однако по нему видно, что излишняя краткость для продающего текста – только минус.

Количество второстепенных лексических единиц, по заключению SEO-профессионалов, не должно превышать 30 % от всего объема слов в статье. Для определения этого соотношения существуют программы. Не нужно спешить выбросить из статьи все, что программа выделила как «мусор». Следует отталкиваться от того, как воспринимается текст, легко ли его читать.

Нелишним будет снова напомнить, что хоть поисковые системы и не обращают внимания на стоп-слова в тексте, без них невозможно написать связный материал, способный привлечь интерес пользователей. Важно научиться чувствовать равновесие между явным недостатком и очевидным переизбытком шумовых слов, уметь создавать сбалансированное отношение с общим объемом текста и фразами-ключами.

Отсутствие или недостаток второстепенных слов в тексте делает материал сухим, плохо читаемым, удобным для поисковых систем, однако абсолютно непривлекательным для пользователей сайта. А перенасыщенность шумовыми словами повышает водность, размывает смысл, усложняет восприятие сути статьи.

Норма стоп-слов в тексте – примерно 30 % от общего количества лексических единиц. Уровень приемлемой тошноты, которая также зависит от процентного содержания стоп-слов, расписан в таблице.

Количество символов

Количество слов

Допустимая тошнота текста*

До 1000

~166

До 3

До 2000

~335

До 3,5

До 3000

~500

До 4

До 4000

~668

До 4,5

До 5000

~833

До 5

До 6000

~1000

До 5,5

До 7000

~1166

До 6

*Здесь приведены средние значения, примерно подходящие для любой тематики.

Скачайте полезный документ:

Чек-лист: Как добиваться своих целей в переговорах с клиентами

Всегда нужно помнить, что роботы поисковых систем все стоп-слова заменят маркерами и будут их пропускать. Учитывайте это, когда создаете поисковые запросы, ключевые фразы для SEO-текстов и определяете плотность их вхождения. При этом важно, чтобы материал не потерял читабельность. Существует ряд сервисов и программ (специально предназначенных для проведения SEO-анализа), которые выявляют норму стоп-слов в тексте.

Онлайн-сервисы для проверки текста на стоп-слова

Многие авторы с большой неприязнью относятся к идее проверять качество написанного материала через придуманные сервисы: типа, как робот может оценить гармоничность полета мысли? Здесь можно возразить: не обязательно то, что автор считает идеальным, в действительности не содержит ошибок. Это могут быть как системные недочеты, так и самоповторы, неуникальность материала, неправильная орфография, описки и многое другое.

Специально разработанные сервисы находят стоп-слова, определяют их количество, проверяют материал на тошноту. Весьма популярна у веб-разработчиков TEXTUS PRO – простая в использовании программа, в которой необходимые параметры можно настраивать.

С помощью этой программы можно:

  • определить, какие есть стоп-слова в тексте и сколько их;

  • выявить их конкретные места расположения;

  • проверить материал на тошноту;

  • определить число слов, знаков (с пробелами и без них);

  • выявить частоту вхождения ключей и их местоположение.

Многие онлайн-сервисы умеют находить стоп-слова и определять количество воды в тексте.

  1. Тext.ru

  2. Это популярная биржа контента, где есть и сервис проверки. Он проводит анализ уникальности, выявляет плагиат и рерайт. Разработчики подчеркивают использование программой «эффективных алгоритмов для глубокой и точной проверки».

    Сервис онлайн-проверки Text.ru не только анализирует уникальность, но и определяет норму стоп-слов в тексте, процент спама и воды.

    Тext.ru

    Программа работает «в пределах разумного» и отбрасывает как воду или спам только фразы и обороты, не несущие важного смысла.

    Плюсы сервиса:

    • бесплатный, легок в использовании, объем материала для проверки – до 15 тыс. знаков;

    • автоматически находит орфографические ошибки, проводит SEO-проверку, выявляет тошноту и водность;

    • делает анализ страниц сайтов и документов;

    • не отбрасывает устойчивые словосочетания (имеет большое значение, если материал узкоспециализированный).

  3. Advego

  4. Бесплатный инструмент, который в онлайне проводит семантический анализ текстов. Определяет количество знаков в документе, водность, заспамленность и академическую тошноту.

    SEO-проверка в качестве «мусора» отбрасывает частицы, союзы и предлоги.

    Advego

  5. «Главред»

  6. Инструмент находит и удаляет общие фразы, штампы, стоп-слова в тексте, канцеляризмы, неподходящие обобщения, воду. Он выявляет все эти недочеты и помогает их исправлять. Отлично работает с рекламными, информационными текстами, заметками, статьями, деловыми письмами.

    Для оценки документа используется 10-бальная дробная система. Это позволяет дорабатывать статью в онлайне и тут же видеть, как улучшаются показатели.

    Главред

    «Главред» выявляет мусор и помогает его убрать. Материал после этого воспринимается легче, полезная информация освобождается от лишней «шелухи».

    Сервис оценивает водность текста, но не проверяет на уникальность и тошноту.

    Плюсы инструмента:

    • в онлайне проверяет материал в течение 3–5 секунд;

    • дает возможность увидеть статью под другим углом, понять принципы написания качественных текстов;

    • не просто выделяет неудачные слова и обороты, но дает к ним пояснения, подсказывает варианты перефразирования;

    • находит и предлагает замену для сомнительных фраз и слов;

    • позволяет вносить правки прямо в онлайн-окне, на других фрагментах метки при этом остаются.

    Минусы:

    • не анализирует уместность «сомнительных» слов в контексте, поэтому даже в случае их оправданного использования может занижать оценку;

    • не работает над орфографическими и пунктуационными ошибками;

    • на текст в кавычках смотрит как на цитату и не проверяет его;

    • слова с опечатками игнорирует, не видит ошибок в них и не учитывает при анализе.

  7. «ТУРГЕНЕВ»

  8. Задумывался как способ противостояния фильтру «Баден-Баден». Сравнительно новый инструмент, анализирующий документ на водность и неинформативность.

    ТУРГЕНЕВ

    За несколько секунд проверяет предоставленный материал. Анализирует стиль, удобство восприятия, количество воды.

  9. Istio

  10. Инструмент дает SEO-оценку документу, проверяет орфографию, находит стоп-слова в тексте, шаблоны, лишнюю воду. Умеет «понять» тематику материала, дает анализ ключевым словам и фразам, формирует облачную «карту» слов, использованных чаще всего.

    Обладает удобным интерфейсом и при этом мощным и многоплановым функционалом.

Istio

Плюсы:

  • более широкий набор инструментов в сравнении с другими сервисами;

  • высокая скорость работы;

  • удобный информативный интерфейс;

  • проводит углубленный анализ документа и выдает подробную статистику.

Минусы:

  • может ошибиться с определением тематики. В тексте словарное ядро «интеллект, поведение, отрасль» программа восприняла как подходящее для тематики «погода, работа, прочее». Почему – непонятно.

  • странно рассчитывается водность. Она не может быть целых 50 % в информационной статье, причем проверка этого же материала на других ресурсах выдает результат не выше 20 %.

Дмитрий Свистунов

Облако тегов

Понравилась статья? Поделитесь:

Сервис проверки стоп-слов в тексте.

Это бесплатный сервис по проверке текста на стоп-слова.

Подробнее о создании и особенностях скрипта читайте тут.

Данный сервис проверит ваш текст на прилагательныеклише, вводные слов и обороты. В качественном тексте есть и то и другое, но в весьма незначительном количестве. Обычно, высокий процент указанных слов свидетельствует, что авторы налили в текст налили лишней воды (речь о seo-текстах, а не о художественных произведениях).

Процент слов

Допустимый процент прилагательных и оборотов вы можете определить для себя сами, прогнав через сервис несколько статей, которые вы считаете однозначно качественными.
Да, сервис не идеален. Если какие-то стоп-слова система не словила — напишите о них в комментариях.

А теперь вы можете перейти на Главную
или посмотреть другие интересные записи из рубрики Вебмастеру, Интернет-Сервисы.

Понравился пост? Добавь в закладки (Ctrl + D), подпишись на новости блога. Благодарю за плюс:

Знание стоп-слов помогает контролировать уместность и правильность их употребления. В контекстной рекламе такие слова используются для формирования эффективных поисковых запросов. Яндекс позволяет менять правила работы с ними при использовании специальных команд. В тексте они также играют немаловажную роль и влияют на поисковую выдачу.

Что такое стоп-слова

Понятие стоп-слово появилось недавно и стало широко употребляться с развитием Интернета. Это уже практически официальный термин. Им обозначают не только слова, но и фразы.

Стоп-слова это — дополнительные слова, которые не несут смысловой нагрузки. К ним относятся местоимения, частицы и некоторые общеупотребительные глаголы. Они важны в работе интернет-маркетолога, копирайтера, редактора. Общий смысл термина одинаков, но в каждой сфере его использование имеет свои особенности.

В тексте

В копирайтинге стоп-слова связаны с критерием водности. Чем больше их в тексте, тем выше процент «воды». Его можно посмотреть, загрузив текст на сервис проверки или сверившись со специальным списком.

Каждый ресурс имеет свой алгоритм вычисления, поэтому показатель на разных сайтах может отличаться. Некоторые сервисы считают отдельно водность и стоп-слова. Их разделяют на следующие категории:

  • междометия: ах, ух, ну;
  • местоимения: вы, этот, какой-либо;
  • вводные конструкции: возможно, во-первых, по мнению специалистов;
  • слова-усилители: совершенно, нисколько, максимально;
  • оценочные суждения: сильный, красивый, плохой;
  • штампы: шаг за шагом, так или иначе, индивидуальный подход;
  • очевидные формулировки: этот сайт, в данном исследовании, нажмите тут;
  • модальные глаголы: можно, нужно, должно быть;
  • страдательный залог: леса вырубают, продукты куплены, выводы сделаны.

В контекстной рекламе

Поисковые системы считают стоп-слова ненужной информацией. Поэтому они не всегда учитываются алгоритмами показа рекламы в Яндекс.Директ. Есть специальные списки стоп-слов, которые можно найти в сети. В них представлены предлоги, союзы местоимения и их формы.

Чтобы включить стоп-слово в поисковый запрос, нужно использовать специальные символы:

  • оператор «!» перед стоп-словом: квартиры +в Москве;
  • оператор «+» перед стоп-словом: квартиры !в Москве;
  • слово внутри ключевого запроса в кавычках «квартиры в Москве»;
  • слово между квадратных скобок: квартиры [в Москве] в кредит.

Как влияют на ранжирование

Стоп-слова не всегда влияют на ранжирование. Для поисковых запросов однозначные числа не индексируются, но номера телефонов, адреса и прочее попадают в индекс, поскольку считаются важными.

Если для запроса стоп-слово значимо, то можно поставить перед ним «+», и тогда оно будет учитываться.

Что касается мусорных слов в текстах на сайте, то для Google, например, правильный текст больше значит, чем показатели сайта. То есть на первых страницах в выдаче те ресурсы, где грамотно написаны статьи. У Яндекса иначе — сайт со слабой статьей может быть на первой странице, но не на первом месте.

Какие стоп-слова не нужно использовать

Существуют слова и фразы, которые не рекомендуется использовать в большинстве случаев. К ним относятся вводные обороты, например: в наше время, как некоторые говорят и т.д.

В список также попадают частицы, предлоги и некоторые часто используемые слова. Их применения нельзя избежать полностью.

В список стоп-слов для копирайтера входят следующие категории:

  • слова, которые относятся к псевдо-коммерческому стилю (например: скачать, бесплатно);
  • бренды конкурентов;
  • слова, относящиеся к видеоиграм или часто используемые в социальных сетях;
  • нецензурная и порнографическая лексика;
  • слова, не относящиеся к теме сайта;
  • запросы, связанные с софтом.

Как проверить текст на стоп-слова

Для проверки наличия стоп-слов используют:

  • Онлайн-сервисы. Там можно вставить текст статьи в соответствующее поле и провести проверку. Будет указано количество воды в статье. Если ее необходимо снизить, сервис подскажет, на что обратить внимание. Он может предложить, например, список стоп-слов с указанием частоты употребления и подсветить их в тексте. Заменив слова, можно уменьшить показатель водности.
  • Список стоп-слов. Можно проверить уместность использования слов, понизив водность текста.
  • Стиль. Если текст пространный и малоинформативный, его нужно переделать.

Полностью от водности избавиться невозможно. Использование стоп-слов в языке нормально. Важно не допустить излишнего употребления и снижения качества текста.

Онлайн-сервисы для проверки

Самый распространенный сервис — Text.ru. Он проверяет уникальность, орфографию и SEO. На вкладке SEO-анализа указан процент “воды” в тексте. Также эта площадка — биржа копирайтинга, где можно заказать статью или стать исполнителем.

пример сервиса поиска стоп-слов

Для определения водности часто используют сервис Advego. На нем проверяют уникальность и другие параметры текста. Также он показывает список и количество стоп-слов.

пример сервиса для определения водности

Очень популярен Главред. От предыдущих ресурсов он отличается тем, что ставит тексту оценку по десятибалльной шкале. Он указывает на стоп-слова, канцеляризмы, штампы, неуместные обобщения.

Сервис выделяет проблемные слова в тексте. При наведении на них курсора появляется объяснение, почему их не рекомендуют использовать. Исправляя текст согласно советам Главреда, можно повысить качество.

Заключение

Главный минус стоп-слов — они затрудняют читаемость текста и негативно влияют на появление статьи в поисковой выдаче. Если таких слов не много, то материал воспринимается легко, а читать его интересно. Но не стоит отказываться от их употребления совсем, поскольку материал пишут в первую очередь для людей, а не поисковиков.

Чтобы убедиться в качестве написанного текста, воспользуйтесь бесплатными онлайн-сервисами проверки, самостоятельно перечитайте написанное. Если можно что-то вычеркнуть, не нанося ущерб смыслу и построению текста, значит это лишнее, и его можно убрать.

Помните, что грамотный и сильный текст лучше ранжируется и привлекает посетителей на сайт.

Есть слова, которые мы все любим писать, но ненавидим читать. Посмотрите, нет ли их в вашем тексте: без них предложение не потеряет красоты, зато его с удовольствием дочитают. Сейчас вы увидите, как это работает.

Слова, которые портят ваш текст. Объясняет Максим Ильяхов

Стоп-слова

Стоп-слова — первый инструмент, которому учит инфостиль. Если вы научитесь удалять стоп-слова из текста, вы будете писать лучше коллег. Текст без стоп-слов подтянутый и точный, но всё еще не означает сильного содержания, поэтому начнем со стоп-слов, а потом, если захотите, продолжим о содержании.

Что это

Стоп-слова — это слова, которые чаще всего удаляются из текста без потери смысла. Давайте рассмотрим примеры:

Со стоп-словами

  • На сегодняшний день одной из самых актуальных проблем россиян является проблема безработицы

Без стоп-слов (варианты)

  • Россияне боятся безработицы
  • Россияне страдают от безработицы
  • Уровень безработицы в России — столько-то процентов

Стоп-слова сами по себе не плохие, и на каждое стоп-слово есть ситуация, когда его нужно использовать. Но чаще всего авторы используют их не к месту.

Слова, которые портят ваш текст. Объясняет Максим Ильяхов

Как работать со стоп-словами

Когда встречаете в тексте стоп-слово, разберитесь, действительно ли оно лишнее. Что будет, если его убрать? Потеряет ли текст смысл? Если не потеряет или потеряет незначительно — удаляйте.

Со стоп-словами

  • В настоящее время россияне крайне озабочены проблемой обвала курса рубля

Без стоп-слов

  • Россияне боятся обвала рубля

После удаления посмотрите, как сделать текст интереснее. Вместо неинформативного набора слов добавьте интересную информацию.

  • В настоящее время россияне крайне озабочены проблемой обвала курса рубля.

или

  • По данным ФОМ, 40% россиян следили за курсом рубля в октябре 2020 года.

Так у вас получился честный и интересный текст.

Не только удаляйте, но и наполняйте! Иногда редакторы останавливаются на первом шаге: только удаляют стоп-слова. Этого мало. Я советую сначала «сушить» текст, потом наполнять.

— Но, сэр, разве же это редактура? Вы же не исправляете текст, а меняете его смысл! Вам же придется изучать матчасть!

— Вы правы. Чтобы получился хороший текст, мало поменять слова местами. Придется работать со смыслом.

Категории стоп-слов

В базе Главреда 1000 стоп-слов, и это не полный список. Заучивать их бессмысленно. Куда полезнее понимать принцип стоп-слов, их смысловые категории. Если вы знаете категории, вы увидите стоп-слова даже если их не видит Главред. В моей системе семь категорий:

Вводные конструкции
Усилители
Оценка
Паразиты времени
Штампы
Отглагольные существительные
Всё неопределенное

В этом письме я кратенько пройдусь по некоторым категориям, а в следующих разберу подробнее.

Слова, которые портят ваш текст. Объясняет Максим Ильяхов

Вводные конструкции

Вводное — это всё, что вводится в предложение через парные запятые, тире или скобки. Давайте посмотрим примеры:

Нет

  • Этот смартфон, бесспорно, будет пользоваться спросом
  • Кстати, мы принимаем предзаказы уже сейчас
  • Качество смартфона, мягко говоря, не соответствовало рекламе

Да

  • Смартфон будет пользоваться спросом, потому что…
  • Принимаем предзаказы
  • Смартфон оказался паршивым

Когда автор выделяет такую конструкцию запятыми, он говорит нам, что это менее важная информация. Попробуйте механически удалить вводную конструкцию и посмотрите, как предложение не становится хуже. Меньше слов, больше смысла.

Усилители

Стоп-слова из этой категории усиливают значение других слов: очень быстрый процессор, максимально выгодный кредит, абсолютно надежный банк, самый лучший фильм, совершенноотвратительный сценарий.

Усилители хороши тем, что за каждым из них стоят скрытые факты. Самый лучший — по чьему мнению? Абсолютно надежный — почему? Максимально выгодный кредит — в чем выгодный? Ответьте на эти вопросы, и станет информативно:

Нет

  • Предлагаем кредит на максимально выгодных условиях
  • Ну очень низкие цены на Айфоны!
  • Совершенно отвратительный сценарий

Да

  • Льготный кредит наличными для госслужащих под 10,3% годовых
  • Взломанные Айфоны за 20 000 рублей
  • Сценарий отвратительный: нет эволюции героев, логика нарушена, шутки несмешные

Копирайтер здесь усомнится: а как же читатель поймет, что ваш продукт очень выгодный, если ему прямо об этом не сказать?

Дело вот в чем. Когда вы говорите читателю «Это очень выгодно», он вам не верит. Все уже наелись этой брехни. Чтобы читатель вам поверил, приведите доказательства, причем такие, чтобы ваша мысль стала понятной и без усилителя.

Не пишите «Очень выгодные кредиты под 12,3% годовых». Объясните, почему это выгодная процентная ставка. Объясните, почему на Айфоны такие низкие цены. Расскажите подробнее, чем вам не понравился сценарий. Сила хорошего текста не в волшебных словах. Сила в правде. Когда вы доказываете свою точку зрения, правда на вашей стороне

Оценка

Чтобы текст был убедительным, в нем должна быть правда. А правда — в фактах и доказательствах, а не авторской оценке. Красивый, умный, качественный, недорогой, быстрый, выгодный — оценки.

Нет

  • Это очень богатый парень
  • Магазин доступных цен
  • Это невероятно известный писатель

Да

  • Его состояние — 18,6 миллиардов долларов. Он на сороковой строчке списка «Форбс»
  • Продукты и хозтовары со скидкой для пенсионеров
  • Его последний роман издали тиражом в полмиллиона экземпляров — при среднем тираже в 10 тысяч.

Когда вы говорите, что писатель «невероятно известный», вы на самом деле ничего не говорите. Это ваша оценка, которая (простите за прямоту) читателя не интересует. Избавляйтесь от оценок и насыщайте текст фактами, будет здорово.

Паразиты времени

Всё, что вы пишете, по умолчанию относится к настоящему времени. Если вы пишете о чем-то, что происходит сейчас, об этом не нужно отдельно писать. Все это и так подразумевают.

Паразиты времени — это бессмысленные отсылки к настоящему времени. Чаще всего с них начинаются пространные брехливые статьи.

Нет

  • В настоящее время мы наблюдаем резкий спад курса рубля

Да

  • Рубль падает

Эти фразы считаются паразитами только тогда, когда в тексте нет противопоставления с прошлым. Если противопоставление есть, то это не паразит:

  • Десять лет назад мы смотрели фильмы с пиратских дисков и бережно их хранили. А сегодня фильм проще скачать из интернета, чем найти от него диск на полке.

Штампы

Штамп — это несколько слов, которые «сцепились» в устойчивую конструкцию. Эту конструкцию легко заменить одним емким словом или написать более точно:

Нет

  • Шаг за шагом мы двигаемся к завершению проекта
  • Скорость интерфейса хромает на обе ноги
  • Наша команда профессионалов нацелена на решение широкого спектра задач вашего бизнеса

Да

  • Постепенно доделываем проект
  • Интерфейс тормозит
  • Оформляем и запускаем интернет-магазины для существующих торговых сетей

Отглагольные существительные

Самая сильная, динамичная и емкая часть речи — глагол. Используйте глаголы везде, где получается.

Самое страшное, что можно сделать с глаголом — превратить его в отглагольное существительное. В нем нет действия и энергии:

Нет

  • Оказываем услуги по созданию и продвижению сайтов и приложений
  • Проводятся ремонтные работы на дорожном полотне
  • Предоставляем услуги по подбору персонала

Да

  • Создаем, запускаем и продвигаем сайты и приложения
  • Ремонтируем дорогу
  • Подбираем и нанимаем сотрудников

Корпорации и чиновники любят отглагольные существительные. Дескать, это звучит более официально и вызывает больше уважения. Более официально — это правда. А насчет уважения — как по мне, его следует заслужить чем-то более полезным, чем казенный язык.

Всё неопределенное

Информационный стиль заставляет авторов писать правду, предъявлять факты и быть точным. Неопределенные местоимения, наречия и частицы делают ровно обратное: скрывают правду и делают вид, что информация есть. А ее нет:

Нет

  • В итоге мы как-то сдали проект
  • Что-то я сегодня не в форме
  • Кто-то говорил, что первым женским достоинством является скромность

Да

  • Мы работали месяц без выходных, и в итоге сдали проект
  • Я сегодня не в форме
  • Карамзин писал, что всегда и везде первым женским достоинством была скромность
Слова, которые портят ваш текст. Объясняет Максим Ильяхов

Закрепим

Теперь вы знаете основные категории стоп-слов.

Потренируйтесь находить эти стоп-слова в Главреде: скормите свой текст или попробуйте один из примеров. Главред найдет большую часть стоп-слов, но не все.

В следующих частях расскажу об этих категориях подробнее.

Ваш Главред.

P. S. Подпишитесь на канал @glvrdru в Телеграме, чтобы ловить свежайшие статьи о тексте и редактуре.

Как собрать список минус-слов для запуска рекламы?

В конце подборка 10+ готовых списков для тех, кому некогда работать с семантикой

Чтобы показывать рекламу только целевой аудитории, нужно соблюдать несколько принципов: подбирать релевантные запросы, правильно настраивать таргетинги, а также использовать минус- и стоп-слова.

Но для начала нужно собрать семантику, а потом добавить в рекламную кампанию. Подробности — в статье. А в конце бонус — подборка с готовыми списками минус-слов.

Что такое минус-слова

Минус-слова и минус-фразы — это слова и словосочетания, по запросам с которыми объявление показываться не будет.

Например, вы продаете запчасти для конкретных автомобилей — Ауди. Объявление с фразой «запчасти для автомобиля» будут показаны по разным запросам: «запчасти для автомобиля Фольксваген», «запчасти для автомобиля Мерседес» и так далее. Чтобы показывать объявления только целевой аудитории — нужно добавить минус-слова и минус-фразы. 

Типы минус-слов

Информационные. Это слова «как», «почему», «где», «зачем» и так далее. Они не подходят для продвижения коммерческих страниц.

Коммерческие. Это запросы «купить» или «заказать». Они не подходят для продвижения информационных порталов.

Нерелевантные. Это общие фразы по типу «фото», «видео», «своими руками», «установить» и так далее. Они не помогут в продвижении коммерческого проекта, но могут привлечь трафик на информационный сайт.

Индивидуальные. Это фразы, которые не подходят под деятельность бизнеса. Например, если у компании нет самовывоза, то фразы «самовывоз», «самовывозом» для нее будут минусовыми.

Что такое стоп-слова

Стоп-слова (шумовые слова) — это знаки, символы, служебные части речи, местоимения, союзы, междометия, и любые слова не несущие самостоятельно никакой смысловой нагрузки. Они игнорируются рекламными системами.

Например, при запросе пользователя «как и когда собирать грибы» для показа будут отобраны объявления, в которых есть ключевая фраза «собирать грибы». «Как», «и», «когда», на будут в этом случае являются стоп-словами.

Список стоп-слов можно посмотреть в справке Яндекса.

Зачем использовать минус- и стоп-слова

Минус-слова помогают показывать рекламу только по релевантным запросам для целевой аудитории. Без них реклама будет показана в выдаче всем, кто вводит в поиск фразы с неподходящими словами.

Поэтому минус-слова помогают сэкономить деньги на нецелевых переходах по вашему объявлению.

Также они помогут поднять CTR объявления, потому что его покажут людям которые с большей вероятностью сделают клик.

Стоп-слова снижают количество показов объявления целевой аудитории.

Например, по ключу «дом +в Екатеринбурге», объявления будет показываться только по запросам, где есть все эти 3 слова. А по запросам «дом Екатеринбург» или «купить дом Екатеринбург» объявление уже никто не увидит. Такие ключи придется отдельно добавлять в кампанию. Но если в кампании будет один ключ «дом Екатеринбург», то объявление будет показываться по запросам «дом Екатеринбург», «дом в Екатеринбурге» и так далее.

Можно проверить в Яндекс Вордстате, стоп-слово перед вами или нет. Если на введенное слово нет запросов — это стоп-слово. Если в списке запросов перед словом стоит оператор «+» — это стоп-слово.

Особенности использования минус-слов в Яндекс Директе и Google Ads

В Яндекс Директе нужно осторожно использовать минус-слова, если рекламируетесь в РСЯ. Дело в том, что при использовании минус-слов РСЯ исключает из показов целые площадки. Поэтому тысячи потенциальных клиентов могут не увидеть ваше объявления.

В Google Ads минус-слова имеют соответствие: широкое, фразовое и точное.

  • Широкое. Означает, что объявление не будет показано по запросам, которые включают минус-слово или часть минус-фразы в любом порядке.
  • Фразовое. Не показывает объявление по запросу, который содержит минус-слово или фразу полностью. Но если фраза разбита другим словом — показ будет.
  • Точное. Показа не будет, если запрос полностью совпадает с минус-словом или фразой. Если в запросе будут и другие слова — объявление покажется пользователю.

Еще одна особенность минус-слов в Google — в КМС используется только точное совпадение.

Как бесплатно подобрать списки минус-слов

Есть несколько способов, рассказываем о каждом. Но сначала — как подбирать минус-слова.

Главное в подборе — вычеркнуть все, что не приведет целевую аудиторию на сайт. Это могут быть:

  • Слова-омонимы. Например, если вы продаете ароматизаторы для автомобилей, то ароматизаторы для выпечки, дома и т. д. нужно исключать из показов.
  • Названия производителей, марок и единиц товаров, которые вы не продаете.
  • Географические добавки с регионами, в которые вы не поставляете свой продукт.

Через Яндекс Вордстат

В этом случае нужно просмотреть все собранные ключи и вычеркнуть из списка те, которые точно не подходят под ваш бизнес. 

Допустим, мы продаем телефоны Xiaomi. Соберем минус-слова на основе запроса «Xiaomi». Для этого переходим в wordstat.yandex.ru и вбиваем запрос.

pic

Пример минус-слов для бизнеса, который продает телефоны Xiaomi

В результате мы видим список популярных запросов и из них выбираем слова, которые не соответствуют нашему бизнесу. В данном случае мы можем добавить в минус-слова «телевизор», «tv», «робот пылесос», «band», «наушники» и так далее.

Упросить работу с Wordstat можно с помощью расширения для Google Chrome Wordstarter или Yandex Wordstat Assistant. Эти расширения помогают формировать список минус-слов по клику рядом с нужной фразой. Потом из этих форм можно скопировать собранные слова и вставить их в Яндекс Директ или Google Ads.

pic

Ускоряем сбор минус-слов с помощью расширения

Еще один способ убрать из выдачи Вордстата уже известное минус-слово — написать его в запрос и поставить перед ним «!» или «-». В случае с «!» в выдаче не будет слов в указанной словоформе. А благодаря «-» не будет учитываться слово во всех словоформах.

С помощью Livepage

Этот инструмент похож на расширения для Яндекс Вордстата. Здесь нужно добавить ключи в окно «Ваши запросы» и нажать «Начать сбор минус-слов».

А в разделе «Кликай по минус-словам» нажимать на те фразы, которые хотите исключить из показа.

С помощью планировщика ключевых слов от Google

Этот вариант подойдет тем, кто собирает актуальное ядро для Google Ads. Для этого в планировщике ключевых слов нужно создать новый план и отсортировать запросы в порядке убывания частотности. Потом среди них вычислить нерелевантные и отнести их к минус-словам.

Важно! Google не умеет склонять минус слова. Поэтому после сбора минус-слова можете прогнать их через сервис robot.tochno-tochno или подобный — он просклоняет подобранные фразы.

С помощью сервисов автоподбора минус-слов

В сервисах автоподбора нужно указать нужные поисковые запросы, а система на их основе подберет минус-слова. Недостаток в том, что такие сервисы могут не точно подбирать минус-слова или добавлять в них нужные поисковые фразы.

Примеры таких площадок — Brandmaker, kparser, tools.yarochenko.

Последний сервис работает так: вставляете в левое поле запросы, а в правом автоматически получаете результаты с кросс-минусовкой для фраз, в которых она нужна.

pic

Пример выдачи минус-слов в сервисе tool.Yarochenko

Если ваши ключевые слова или минус-слова записаны в строчку — преобразуйте их в столбцы с помощью сервиса 4memo. Иначе сервисы не распознают отдельные слова и фразы.

Где искать готовые списки минус-слов

Необязательно составлять списки минус-слов самостоятельно. Можно взять готовые и добавить их в рекламную кампанию. Вот где можно найти такие подборки:

Продалет. На этом сайте есть 28 готовых списков с универсальными минус-словами и словами для конкретных тематик: б/у, ремонт, электронная коммерция и др.

Semtools. Здесь собрано 23 списка минус-слов для Яндекс Директа. Автор подготовил универсальные минус слова, а также прошелся по темам лечения, ремонта, оптовой продажи и много другого.

265 стандартных минус-слов для Яндекс Директа. Здесь собран универсальный набор.

Универсальный набор минус-слов от AgentSEO.

Google Таблицы с разными списками: универсальным, для eCommerce, для крупных интернет-магазинов по типу Ozon и Wildberries, для 1 500 городов России. Источник — smlmarketing.

ЭКСКЛЮЗИВЫ ⚡️
Читайте только в блоге
Unisender

Поделиться

СВЕЖИЕ СТАТЬИ

Другие материалы из этой рубрики

документ

документ

Не пропускайте новые статьи

Подписывайтесь на соцсети

Делимся новостями и свежими статьями, рассказываем о новинках сервиса

«Честно» — авторская рассылка от редакции Unisender

Искренние письма о работе и жизни. Свежие статьи из блога. Эксклюзивные кейсы
и интервью с экспертами диджитала.

unisender

Добавить комментарий