как узнать кто автор статьи в интернете
Апгрейд инструмента проверка уникальности — первоисточник и неуникальные фрагменты
Россия, Москва, посленовогодний постапокалипсис, 9 января 2017 года.
Команда проекта прокачала инструмент «Проверка текста на уникальность». Теперь с его помощью можно численно определять сайты-первоисточники по фрагменту текста (рекомендуется) или URL и выгружать для рерайта/анализа неуникальные фрагменты текста.
Как это работает?
Пара иллюстраций
1. Взят текст со страницы. По факту — текст неуникальный, он уже проиндексирован поисковой системой. Но мы хотим понять, является ли наш сайт первоисточником по нему или конкуренты, которые украли текст, смогли присвоить его (частая история)?
Проверяем — выдыхаем. Лишь по 9% фрагментов текста наш URL не выдается как первоисточник в Яндексе. Не страшно:
2. Взят текст из рубрики каталога. По факту, авторство/уникальность текста внутри домена — «размазана» по нескольким страницам. Не самый хороший признак. Но, других доменов среди первоисточник нет — хорошо.
3. Бывает, что текст был впервые размещён на одном сайте, но, потом он стал неуникальным и авторство потерялось. Это уже фирменная беда. Теперь её можно быстро диагностировать с помощью бесплатного инструмента «Пиксель Тулс».
Выгрузка в CSV и исключение доменов из анализа
При привычке — можно выгрузить данные анализа уникальности в CSV, а также исключить с помощью настроек несколько доменов из анализа.
Проверяйте уникальность и определяйте первоисточник правильно!
12 способов разыскать владельца сайта и узнать всё про него
Очередной мануал для начинающих разведчиков.
Информация о владельце домена является конфиденциальной и предоставляется регистратором только по запросу органов власти. Но есть несколько возможных способов выведать ее. О них и расскажем в этой статье.
Зачем это нужно: найти управу на человека, который нагло ворует ваш контент, оценить платежеспособность владельца сайта перед тем как сделать ему предложение о покупке, найти специалиста в узкой области, который пишет для своего блога толковые статьи, но подписывается обезличенным никнейном и т.п.
1. Смотрим историю whois
Начать стоит с проверки сайта на who.is. На скрине показан пример, когда c помощью этого сервиса стал известен не только email, но также мобильный телефон и адрес владельца (такое бывает, если очень повезет). Я в шоке от политики приватности своего хостера! В большинстве случаев отображается только ссылка, по которой можно отправить сообщение владельцу домена через регистратора. И с ее помощью есть шанс узнать много интересного.
2. Пытаемся связаться с ним официальным способом
Отправив сообщение через регистратора, можно выведать действующий email человека, его фамилию/имя, контактный телефон и IP-адрес, которые помогут полностью идентифицировать его личность (см. статью 15 фишек для сбора информации о человеке в интернете).
Результат зависит от удачи. Неизвестно проверяет ли человек ту почту, которую указал при регистрации домена и насколько достоверные предоставлены им данные. Также важны ваши навыки социнженерии. Можно предлагать инвестиции, представляться ассистентом Юрия Мильнера:-), убеждать что нужно непременно созвониться по телефону или скайпу, спросить о возможности личной встречи. Главное убедить человека, что судьба подкинула ему реальный шанс заработать и выпросить максимум данных, которые можно применить в дальнейшей разведке.
Желательно добавить фразу: «Пожалуйста, дайте мне знать, что предложение вам не интересно». Это увеличивает шанс того, что человек из вежливости черкнет пару строк, засветив свою почту, имя и IP-адрес.
Также стоит написать всем предыдущим владельцам домена, с просьбой дать контакты тех людей, которым они передали его. Если повезет, то в ответе будет: «Продал Васе N, его телефон +791612345…». Но, к сожалению, люди часто бывают скрытны. Но также часто бывают вежливы и отписываются: «Простите, но я не могу поделиться этой информацией». И это уже нам на руку.
Зная электронную почту бывшего владельца (и его никнейм), можно найти его объявление о продаже сайта/домена на специализированном форуме и список пользователей, которые на него откликнулись. Из них можно составить круг возможных нынешних владельцев домена.
3. Ищем сайты, зарегистрированные на имя владельца
Зная адрес электронной почты человека, можно узнать, какие домены на него зарегистрированы. Сделать это можно на domainiq.com. Не исключено, что одним из этих сайтов окажется личный блог, по которому можно установить личность человека.
4. Обращаемся к хостеру
На hostadvice.com можно узнать хостинг-провайдера сайта. Если вы сможете письменно обосновать необходимость предоставления вам данных о владельце, то есть шанс, что хостер поделится ими с вами. Или будет очень упорны (недели настойчивых писем должно хватить).
Обращаясь к кому-то из сферы IT по интернету лучше представляться женщиной (и ставить в профиль скромное фото со светлыми волосами). Неопытные мужчины думают, что блондинки недалеки, не представляют никакой опасности и с радостью оказывают им мелкие услуги.
5. Смотрим информацию о создателях файлов
Google умеет искать не только по html-страницам, но и по разным типам файлов. Вот пример запроса для поиска пдфок на определенном сайте: filetype:pdf site:tech.yandex.ru
Найденные на сайте файлы нужно скачать на компьютер и в свойствах посмотреть их автора, создателя и т.п. Очень многие люди в информации о компьютере указывают свои реальные имя и фамилию, а при выкладке файлов со своей машины в интернете забывают стереть эту информацию.
Google умеет искать файлы со следующими расширениями:
6. Ищем «полезные» файлы в robots.txt
В этом файле владельцы указывают файлы и папки, которые они закрывают от индексации поисковиками. Иногда там могут быть указаны старые страницы с личными данными или фотографиями. Мой опыт показывает, что есть определенная категория людей, которые использует свои сервера в качестве облачного хранилища и кладут туда что попало. Как правило, файл robots.txt лежит в корневом каталоге сайта.
7. Ищем «полезные» страницы в sitemap.xml
В файле с картой сайта: sitemap.xml, который часто располагается в той же папке, что и robots.txt также можно найти страницы, которые могут содержать полезную информацию. К примеру, страницу с контактами, ссылка на которую была убрана с главной страницы.
8. Ищем почтовые адреса, связанные с доменом
Указываем адрес сайта на emailhunter.co и получаем список адресов, связанных с ним.
9. Ищем сайты, которые ссылаются на домен
Указываем сайт в форму поиска на Backlink Checker и получаем 50 ссылок на страницы, которые ссылаются на него. Есть шанс отыскать среди них профили в соцсетях, а также другие проекты владельца ресурса.
10. Проверяем exif-данные фотографий
Иногда люди выкладывают на свои сайты фотографий без их предварительной оптимизации для веба. Можно попробовать посмотреть пару снимков с помощью Jeffry’s Exif Viewer. Таким образом можно узнать адрес владельца и модель его мобильного телефона.
11. Идентифицируем владельца по лицу
Если сайт небольшой, то можно с помощью поиска Google по картинкам и оператора site: посмотреть все изображения которые есть на нем. Не исключено, что среди них может быть его фотография (какой-нибудь admin.jpg пятилетней давности). Личность человека по фото можно установить с помощью findface.ru.
12. Читаем комментарии в исходном коде
Заходим на сайт, нажимаем Shift + Command + U (или выбираем из меню пункт Показать программный код страницы). Сначала просматриваем HTML-код на предмет палевных комментов с именами и никнеймами. К примеру: «BigFatNagibator, проверь это место пожалуйста!». Попутно ищем js-скрипты, которые были написаны владельцем сайта специально для этого ресурса. Не исключено, что в них может оказаться торжественная надпись «Created by Sasha Petrov. Irkutsk» и ссылка на его профиль в Github.
Результативность всех этих методов зависит большой частью от вашего упорства и смекалки. Если владелец сайта не конченый параноик и живет онлайн-жизнью, то обязательно должна быть ниточка, которая поможет найти его.
Если вам не нужно никого искать, но у вас есть проект, владение которым вы хотели бы скрыть, то рекомендую проверить по всем пунктам из статьи степень сложности идентификации своей личности. Может, будете удивлены.
Три простых способа найти владельца сайта и узнать его контактные данные
Проверка через WHOIS
Контактов или формы обратной связи может и не быть. Поэтому приходится искать их самостоятельно. Хорошо, если есть ссылки на социальные сети или мессенджеры, но что делать, если и их нет?
Самый простой и эффективный способ — воспользоваться так называемыми WHOIS-сервисами. Это бесплатные каталоги, которые содержат информацию о владельце домена. Эта информация может быть как закрытой, так и открытой для общего доступа.
Если информация закрыта, то вы не увидите фамилии владельца, в этой графе будет написано «Частное лицо» (Private Person). Но, скорее всего, возможность связаться все же будет.
Во-первых, через сервис, на котором был зарегистрирован домен. Как правило, среди прочей информации можно найти и ссылку на форму обратной связи через регистратора доменных имен. Можно и самостоятельно перейти на сайт регистратора и вбить нужный домен.
Во-вторых, может быть оставлен адрес электронной почты в обычном или зашифрованном виде. В последнем случае это ничуть не помешает отправить письмо, однако вы не будете знать реального адреса владельца.
Если владелец компания, то все может быть еще проще. У компаний обычно есть официальные сайты или странички в соцсетях, где контактная информация должна быть наверняка. Кроме того, о компании можно узнать подробнее, набрав в поиске ее название. Никогда не знаешь, что в итоге всплывет.
Поиск обратных ссылок
Владельцы небольших сайтов часто пытаются раскрутить их, размещая ссылки на форумах, социальных сетях или других сайтах. Таким образом, можно найти контакты владельца или хотя бы человека, связанного с сайтом.
Искать обратные ссылки можно через специальные сервисы, например ahrefs.com.
Стоит отметить, что ссылки могут появляться и естественным образом, иначе говоря, тот, кто дал ссылку, не обязательно имеет отношение к сайту. А вот если она стоит в профиле или на странице в соцсети, то это почти наверняка нужный вам человек.
Время выполнения программы зависит от очереди, приблизительное время проверки 10-20 секунд.
Уникальность текста
Список совпадений
Количество слов | 0 | ||
Символов в тексте Ваш текст будет обрезан до 15000 символов | 0 | ||
Без пробелов | 0 | ||
Время выполнения | 0 | ||
Орфографические ошибки | 0 | Найдены ошибки! | Ошибок не найдено. |
3.0 million
Столько пользователей уже воспользовались нашим сервисом.
О сервисе — Антиплагиат
Антиплагиат разработан по уникальному алгоритму, выполняя анализ текста система выполняет качественный поиск плагиата в тексте — это эффективно помогает студентам, учащимся школ, вузов, а также преподавателям в работе. Проверка текста проводится абсолютно бесплатно, для проверки не требуется регистрации. Вы можете использовать его онлайн с любого устройства, все что вам нужно, это интернет-соединение, чтобы выполнить проверку текста на уникальность.
Сервис будет полезен тем, кто заказывает рерайт текста, чтобы заказчик мог удостовериться в уникальности текста. Для блогера, который должен ежедневно публиковать несколько блогов, им сложно писать уникальный контент, особенно, при написании на одни и те же темы.
В нашем редакторе есть кнопка развернуть на весь экран — это позволит открыть текстовый редактор на весь экран, так работать с текстом станет намного удобнее.
Подсветка слов
После выполнения проверки, текст будет выделен желтым маркером — это текст, который был найден в сети и является плагиатом. В таблице найденных результатов можно выбрать источник плагиата, по которому были найдены заимствованные слова или выражения.
Как составить полный отчет?
После успешной проверки текста на плагиат вам будет доступна кнопка сформировать отчет. В отчет будут занесены все характеристики вашего текста с указанием найденных источников на плагиат, чтобы отчет могли увидеть другие пользователи вам нужно создать ссылку и поделиться ей в любой сети, так же вы сможете распечатать отчет на странице.
Функция — игнорировать домен
По умолчанию функция отключена. Если требуется исключить домен из проверки, то включите данную функцию и введите ваш домен в соответствующее поле, благодаря этому данный источник не будет проходить проверку на Антиплагиат.
Использования API
На данный момент сервис не поддерживает API. Ваши пожелания вы можете направить нам по почте admin@rustxt.ru
Проверить уникальность текста можно через бота в Telegram @check_antiplagiat_bot
Техника для идентификации авторов анонимных текстов в интернете
Xakep #268. F#ck da Antivirus
На хакерской конференции 29C3 Chaos Communication Congress в Гамбурге выступили две девушки с лингвистического факультета, которые представили эффективную технику определения автора анонимных текстов. Техника позволяет работать на текстах разных стилей. Например, можно определить автора научной работы по его сообщениям в чате, и наоборот. На выборке из 100 пользователей подпольных форумов и хакерских чатов система показала точность распознавания 80%.
Один из методов лингвистического анализа — использование служебных слов. Очень часто человек использует одни и те же служебные слова и в научной работе, и в чате. В целом, методика основана на статистическом анализе письменного текста, то есть стилометрии. Стилометрия — прикладная область стилистики, которая занимается анализом текстов в филологии и юридической экспертизе.
Авторы работы считают, что систему стилометрического анализа можно успешно использовать для выявления владельцев ботнетов, продавцов нелегального товара в интернете, авторов вредоносных программ и др. Подобные возможности системы могут заинтересовать правоохранительные органы. Собственно, такие программы создавались и раньше, например, стилометрический фреймворк JStylo или другие программы с использованием скрытого распределения Дирихле (LDA), с помощью которого можно автоматически отличить лексику в разговоре о продаже кредиток от лексики на тему написания эксплойтов. То есть, можно автоматически выявлять разговоры на определённую тематику, сканируя логи сотен подпольных форумов.
Программа осуществила сканирование миллионов сообщений на форумах thebadhackerz.com, blackhatpalace.com, www.carders.cc, free-hack.com, hackel1te.info, hack-sector.forumh.net, rootwarez.org, L33tcrew.org и antichat.ru с участием нескольких десятков тысяч авторов дискуссий. Программа сумела определить 300 тем обсуждений на форумах, самые популярные из которых — кардинг, сервисы шифрования, взлом паролей и инструменты для чёрной поисковой оптимизации. На диаграмме показан анализ текстов с российского форума Antichat.ru.
К сожалению, для определения автора текста нужно как минимум 5000 слов, написанных им лично. Поэтому количество авторов на хакерских форумах, которых удалось идентифицировать, снижается до нескольких сотен.
Тексты на других языках, отличных от английского, переводятся на английский и тоже отлично анализируются программой, с определением автора. Однако, использование жаргона leetspeak существенно осложняет задачу.
Выступление девушек-лингвистов на конференции 29C3 Chaos Communication Congress записано на видео.
Видеофайл в формате flv