Наконец вышла новая версия Адвего Плагиатус. В версии 1.3 произошло довольно много изменений. Самое важное изменение - программа теперь ищет источники рерайта. Но обо всем по порядку.
-- В процессе сравнения документов найденные совпадения выводятся в виде пары цифр - 10%/40%, где первая цифра означает количество найденного копипаста, исходя из размера шингла; вторая цифра - возможное количество рерайта;
-- Лог работы стал более информативным и понятным - убрано отображение неинформативных ошибок;
-- Во время работы подозрительные документы подсвечиваются красным цветом. Подозрительными документами являются такие документы, в которых найдено более 10% копипаста или 30% рерайта;
-- Результатом проверки текста является показатель уникальности текста. Теперь этот показатель состоит тоже из пары цифр - 90%/60%.
Первая цифра (уникальность) показывает количество в документе уникального текста, не копипаста. Это довольно точный показатель, который явным образом характеризует неуникальность документа. Хочу подчеркнуть, что этот показатель характеризует именно неуникальность. Т.е. если программа показывает, что уникальность документа 70%, то, значит, документ однозначно неуникален. Но если программа показывает, что уникальность документа 100%, то однозначно утверждать, что так оно и есть, невозможно (хотя вероятность этого велика). Есть ряд причин для этого, например, исходный документ, с которого осуществлялось копирование, еще не проиндексирован поисковыми машинами или документ недоступен для сравнения и прочие.
Вторая цифра (оригинальность) показывает количество в документе оригинального текста, не рерайта. При расчете итоговой "оригинальности" не учитываются найденные документы с количеством рерайта менее 30%. Проверить, являются ли такие документы источниками рерайта, можно самостоятельно. Мы рекомендуем просматривать документы, в которых найдено более 20% рерайта. Обращаем ваше внимание, показатель "оригинальности" документа носит предположительный характер, невозможно быть стопроцентно уверенным в том, что документ, который совпадает с другим на 60% по "рерайту", действительно является его источником (хотя и весьма вероятно). Возможны случаи, когда это не так. Поэтому показатель рерайта всегда нужно проверять "вручную" - просматривать глазами исходный документ, чтобы убедиться, что это действительно источник рерайта. Если итоговая "оригинальность" ниже 70%, то программа выдает предупреждение "Возможно, рерайт".
Внимание заказчиков! Если текст плохо переработан и вы нашли исходник, то можете вполне обоснованно отказать в оплате либо подать на исполнителя жалобу.
Наличие явных источников рерайтинга является объективной причиной для возврата средств за оплаченную статью с типом текста "Копирайтинг". В причине возврата нужно указывать именно найденный источник рерайтинга, а не показатель уникальности.
Наличие больше 20% значимых совпадений по словам с одним источником является объективной причиной для возврата средств за оплаченную статью с типом текста "Рерайтинг". Если же явных совпадений по содержанию и структуре нет, а совпадения по словам - просто особенность тематики, то качество текста считается высоким.
-- В результате проверки показываются следующие показатели:
- Количество проверенных документов (документов без ошибок); - Количество всего найденных документов; - Общее количество символов; - Количество слов; - Количество символов в словах; - И, конечно, итоговая уникальность текста.
-- Найденные неуникальные фрагменты текста подсвечиваются:
- копипаст - желтым цветом; - рерайт - голубым.
-- Появилась возможность подключиться к службе antigate - это система для автоматического распознавания "капчи". Службу можно активировать в настройках программы. Для функционирования системы вам необходимо иметь специальный ключ.
-- Дефолтные настройки программы ужесточены, теперь по умолчанию размер фразы и шингла равны четырем словам (как говорят заказчики - "4/4"). Процент прерывания поиска установлен в "0" (поиск не прерывается), если вам нужен поиск до первого неуникального документа - установите этот параметр равным, к примеру, 20.
Лирическое отступление. Показатель уникальности в любом случае - оценочная величина. Это цифра. Цифру нужно проверять. Заказчик может требовать уникальность 95% при настройках 4/4. Однако заказчик не имеет права отказывать за уникальную(!) работу, которая по оценке Плагиатуса при настройках 4/4 уникальная на 90%, а не на 95, если это понижение уникальности обоснованно - устоявшиеся выражения, цитаты, названия и т.п.
-- Добавлена загрузка списка "плохих" документов с серверов Адвего. К примеру, страниц с результатами поиска одного поисковика, которые проиндексированы другим. Как только нам станет известно об очередном таком домене - мы его добавим в этот список, и домен будет игнорироваться про определении уникальности.
- излишний мусор в результатах поиска; - квадратики вместо букв на нерусскоязычных системах; - утечки памяти; - падения программы на некоторых страницах.
------------
Надеемся, Advego Plagiatus новой версии и дальше будет являться прекрасным помощником как для оценки готовых документов, так и для написания качественных уникальных материалов.
Внимание, в данной теме запрещено обсуждение ошибок программы. Для того, чтобы сообщить об ошибке программы, перейдите сюда: https://advego.com/blog/read/plagiatus/
Внимание, в данной теме абсолютно запрещено любое упоминание сторонних продуктов для анализа уникальности текстов.
В данной теме запрещается заявлять что-то наподобие этого: "у меня плагиатус показал уникальность 33% но я писал сам". Если у вас такая ситуация - пишите в ЛПА согласно этому документу: https://advego.com/blog/read/plagiatus/79953 с обязательным указанием текста и лога проверки. Если же у вас вопросы по процентам рерайта - прочитайте новость еще раз.
Спасибо за понимание, спасибо за внимание, с уважением, команда разработки Адвего.
Не версия, а не пойми что! Делал рерайт- почти полностью изменил текст а плагиаутс выдал что написанный рерайт неуникальный-соответственно заказ не был оплачен. Скоро все рерайтеры сбегут отсюда ИМХО.
Лично мне кажется, что новая версия программы немного не объективна. Например, пишешь текст про кулинарию или домашние косметические средства. В таких текстах часто употребляются слова и фразы: смешать, нанести, 3-4 раза в неделю, необходимо, положить, добавить и тому подобные. Так вот, плагиатус находит в статье на каком-либо сайте все эти слова, без которых текст по теме просто невозможен и выдает, что второй показатель, например, 65%. Заказчик видит этот показатель и думает, что вместо уникальной статьи он получает рерайт не лучшего качества. Что касается магазина статей. Частенько при добавлении статьи получаешь отказ на размещение с формулировкой "низкое качество переработки". Если посмотреть вышеописанный пример, то переработать подобные тексты без ущерба читаемости написанного просто невозможно. А если, как говорят модераторы, они сами сравнивают написанный текст с источником, который им показал плагиатус, то такая оценка не может быть объективной, так как один модератор посчитает качество переработки достаточно высоким, а другой такой же текст отклонит. Понимаю, что вряд ли что-либо изменится, но все же для большей объективности, хотя бы для магазина статей хотелось бы услышать четкие критерии оценки.
Кулинария, семья, дети - самые простые темы для входа в копирайтинг по уровню знания. И именно поэтому в этих темах крайне сложно писать качественные тексты. Из текста в текст одни и те же слова, одни и те же выражения. Тысячи. Ежедневно. Об одном и том же. И плагиатус просто показывает это.
Вы предлагаете, чтобы плагиатус скрывал данные о тексте?
А вы пропустите статью такого плана, на такую тему в Магазин статей, если плагиатус покажет по ней, например, 75/40 и напишет "неуникальный текст" ? Или автоматически вернете на доработку с тем же вердиктом? Или пропустите, но потом забаните за жалобу, купившего ее человека, который не станет разбираться, а просто взглянув на цифры, напишет жалобу?
А почему раньше Плагиатус не показывал совпадений между автомобильными статьями и статьями детской одежды или другой, совершенно отличающейся тематики? Почему раньше Плагиатус не метил желтым шаблонные фразы, не считал это совпадениями и не занижал уникальность?
И почему раньше уникальные статьи показывались, как действительно уникальные, а сейчас по уникальной с точки зрения здравого смысла статье выносится вердикт - низкая уникальность? В чем улучшение-то, если теперь приходится отказываться от выкладывания целого ряда действительно уникальных текстов в магазин статей?
Сергей, я не говорю об уникальности текста, то, что текст должен быть уникальным - не обсуждается. Но другое дело, что плагиатус выделяет голубым любые слова, которые так или иначе будешь употреблять в тексте просто для того, чтоб он был читаемым. И получается вот что, заказчики, особенно те, кто делает первые заказы и еще не разобрались в работе программы, проверяют присланный текст, видят, что он синий и ошибочно думают, что это очень плохо. У меня таких случаев нет, поскольку давно не работаю по заказам, но предполагаю, что такие случаи были. Что касается магазина статей, то несколько раз были такие ситуации: пишу текст, проверяю плагиатусом, а он находит, что это рерайт, показывая при этом источником сайт, о существовании которого я даже не догадывалась. И приходится переделывать многие фразы, предложения, даже часто делать их менее читаемыми. Понимаю, что копирайта в полном понимании этого слова уже практически не существует. Любой текст в той или иной степени является рерайтом чего-то ранее написанного на эту же тему. И именно поэтому хочется чтоб этот параметр либо не учитывался при добавлении в магазин статей (конечно если это не совсем уж явно переделанный какой-то один текст), либо все же озвучить критерии отбора именно по второму показателю плагиатуса (и снова услышу, что критерий оценки - качественный текст), либо тогда уже уберите эту вторую цифру, чтоб никого не смущать.
Синим выделяются не просто слова. Это слова, которые повторяются в другом документе на 30 и более процентов. В магазине статей эта цифра автоматически(!) не учитывается, ее проверяют вручную.
Плагиатус просто выдает информацию по тексту. Эту информацию нужно анализировать. Может быть так, что вы не видели тот текст, который АП показывает вам как источник рерайта. Ну посмотрите что это за текст. Может это копия источника вашего. Может это рерайт источника вашего. А может случайное совпадение.
Проблемы, о которой вы говорите, не существует. Пока в этой ветке, ни разу(!) не предоставили текст, который бы неверно трактовался АП.
По поводу оказывающих просто так заказчиков - не работайте с такими заказчиками.
И в любом случае - блокировка 3 дня, т.к. текст, который неверно трактуется Плагиатусом, не предоставлен.
Публикация комментариев и создание новых тем на форуме Адвего для текущего аккаунта ограничено. Подробная информация и связь с администрацией: https://advego.com/v2/support/ban/forum/1186