Новая версия Адвего Плагиатус - 1.2.0.91: разблокировка в поисковых системах, ввод капчи... (обновлено 16.03.2012)
[16.03.2012] Обновление до версии 1.2.0.91: - Устранено неверное определение кодировки при копировании из некоторых внешних программ (например, Google Chrome) - Устранено некорректное переключение кодировок - Реализовано перетаскивание текста из других программ - Реализовано перетаскивание текстового файла (plain-text) непосредственно в окно редактирование текста
------------------------ Новое: ------------------------ -- Работа с капчей -- Новый состав поисковых машин -- Поддержка мультиязычных доменных имен -- Подсветка неуникального текста в редакторе -- Поддержка расширенного набора кодировок -- Команда "Убрать теги" - очистка содержимого редактора от html-тегов. Внимание! Если текст не очищен от тегов, то проверка будет выполняться вместе с тегами. -- Команда "Убрать подсветку" - очищает выделенный текст в редакторе после проверки. -- Команда "Блокировки" - ввод капчи и/или принудительная разблокировка поисковых систем. Команда доступна из диалога проверки документа, из главного меню и на панели инструментов. При отсутствии заблокированных поисковых систем функция недоступна. -- Опция "Нижний порог совпадений" - страницы с меньшим числом совпадений, чем заданный порог, в логе работы выводиться не будут.
------------------------ Улучшения: ------------------------ -- Уменьшение потребления памяти и загрузки ЦП -- Улучшен разбор разметки -- Подсчет метрики текста совпадает с подсчетом в Адвего -- Уменьшение размера исполняемого модуля -- Увеличение скорости работы -- Косметические изменения интерфейса пользователя
------------------------ Что такое капча и зачем нужен ее ввод: ------------------------ Advego Plagiatus для своей работы использует поисковые системы - Яндекс, Гугл и т.п. Плагиатус старается вести себя как обычный человек, поэтому поисковики не блокируют пользователя моментально, однако на поисковики все равно идет очень много запросов от пользователя. И для того, чтобы понять, что это человек, а не робот, поисковики периодически блокирую пользователя, дабы спровоцировать пользователя на дальнейшие действия, осуществленные вручную.
Блокировки бывают разных типов - с вводом капчи и без ввода капчи. Плагиатус умеет самостоятельно разблокироваться в поисковиках, если блокировка произошла без требования ввести капчу. Однако, периодически, поисковики предлагают ввести "капчу", и сделать это за пользователя Plagiatus не может.
Предыдущие версии Плагиатуса, последнее время, просто блокировались поисковиками и проверка уникальности могла осуществляться неверно. Теперь можно проверять тексты будучи уверенным, что поисковые системы вас не заблокировали.
Если у вас нет желания вводить капчу - вы можете не делать этого, Плагиатус все равно проверит документ максимально качественно, по мере своих возможностей.
------------------------ Внимание! Normaliz.dll Для пользователей старых версий Windows XP, Windows 2000: ------------------------ Для поддержки многоязычных доменов (к примеру, президент.рф) пользователям Windows XP и Windows 2000 необходимо скачать и установить обновление для операционной системы:
Спасибо за проделанную работу. А количество проверенных урлов почему перестало отражаться? Пишет очень бледненько: "Найдено: 4 страницы. Проверено без ошибок:4". Это о чем? Проверено только 4 сайта?
Никакого резюме о 100-процентной уникальности Плагиатус не дает. Скажу больше - ни одна программа вообще не в состоянии ничего достоверного сказать об уникальности документа. Вот о НЕуникальности сказать можно.
Я не пойму вашей проблемы. Ну 4 документа. Что не так? Сколько должно быть? У вас есть данные о правильном количествве проверенных документов?
<Никакого резюме о 100-процентной уникальности Плагиатус не дает.> Разве не является резюме фраза, появляющаяся после проверки "Уникальность текста 100%" ? ))) Конечно, все прекрасно понимают, что это условность. Но тем не менее, вердикт вынесен, и с ним невозможно не считаться. Поскольку это один из основных критериев, по которому оценивается труд Автора.
От количества обработанных исходных данных зависит достоверность статистического анализа. Чем больше данных, тем достовернее вывод. Это аксиома. В нашем случае, 4 страницы - это практически 0.
Ответьте, пожалуйста, на вопросы. Есть ли у вас данные о правильном количестве страниц? Какая цифра вас удовлетворит? На каком основании? Знаете ли вы, что это за страницы, откуда они берутся и что означают?
Без ответов на эти вопросы обсуждать нечего. Вы мне рассказываете про соленое, называя его красным.
Данных о «правильном» количестве страниц у меня, конечно, нет. Вряд ли такая цифра существует. Но имею опыт практического использования различных программ, проверяющих тексты на уникальность, в т.ч. и АП предыдущих версий. И здравый смысл, который подсказывает, что чем больше тематических страниц проверено, тем достовернее вывод. Исходя из этого, меня устраивает «резюме», которое базируется на проверке хотя бы 100-120 страниц. Если больше, то и доверие к результату возрастает. Читала, что у некоторых АП проверяет до 300 страниц. Мне с таким сталкиваться не приходилось. Может, скорости Интернета не хватает. Отсюда мною и сделан вывод, что 4 страницы – это практически 0.
У вас в рассуждениях огромный пробел, который все ваши рассуждения и аксиомы сводит на нет - вы забываете о том, что происходит до получения Плагиатусом этих 4-х страниц и откуда эти самые 4 (или 400) страницы берутся.
В таком случае, восполните хотя бы парой фраз (конечно, если это Вас не затруднит) жуткий пробел в моем образовании. )) Или хотя бы подтвердите, что проверка 4 урлов и проверка значительно большего числа страниц - равнозначно весомы. И что заключение об уникальности текста, построенного на проверке 4-х стр., также достоверно, как после проверки сотни и больше.
Текст разбирается специальным хитрым алгоритмом Плагиатуса на "фразы" (те самые, которые есть в настройках), фразы отправляются в поисковики, поисковики выдают (или не выдают) результат в виде найденных страниц. Это и есть те самые страницы, о которых идет речь. Если текст очень уникальный или какой-нибудь специфический, то поисковики могут не выдать никаких результатов или выдать мало результатов. Найденные поисковиками страницы выкачиваются и производится сравнение этих страниц с исходным текстом. Сравнение происходит по "шинглам" (тем самым, которые есть в настройках).
В общем это количество страниц ни о чем не говорит. Вообще. Просто информация для размышления.
п.с.: чем больше параметр "фраза" в настройках, тем меньше страниц находит поисковик.
п.п.с.: на комментарий "Проверено всего четыре урл? Что же это за проверка и основание для резюме о 100-процентной уникальности? " отвечать совершенно не хочется.
Поскольку я перфекционист, то 96% мне мало, и я начинаю добиваться хотя бы 98-99%. Поработав над фразами, выделенными желтым цветом, снова запускаю проверку. АП мгновенно выдает результат: проверено 9 страниц, уникальность 100%. Удивляет скорость ответа. В силу своей дремучести расцениваю это таким образом: АП не потрудился должным образом.
Сергей, здравствуйте. Я правильно понимаю, что если проверено 4-12 страниц, но при этом нет ошибок, то такую глубокую проверку можно считать корректной? (не самая популярная тема в сети?)
Программа установилась и работает без проблем, но, как я уже успел заметить, тексты, проверяющиеся на новой версии стали менее уникальными. То есть требуемой уникальности при проверке через новый плагиатус стало добиться СЛОЖНЕЕ. Исходя из этого, сложнее стал труд автора. Судя из того, что я уже попробовал, уникальность выше 95% даже с настройками шингл 4 строка 5 на статье в 2000 символов теперь будет получить сложновато, а на статье в 1000 символов ну просто ооочень сложно. А требуют то и 100%. И как быть?
1. Новый Плагиатус стал работать верно(!). Предыдущие работали менее(!) верно. Если у вас тексты неуникальные - пеняйте на себя, а не на программу.
2. "даже с настройками шингл 4 строка 5",- что значит "даже"? Это вполне нормальные настройки.
3. Если заказчик требует у вас 100% уникальности (да еще и на коротких текстах) - не работайте с таким заказчиком. Уникальность 100% - это паранойя, говорящая о том, что заказчик вообще не понимает что такое уникальность, как она высчитывается и зачем она нужна. Максимальная уникальность, которую можно требовать - процентов 95.
4. Как быть? Работайте качественно, пишите самостоятельно уникальные тексты. Плагиатус тут не причем.
Сергей, простите за глупый вопрос, но какие все-таки настройки нужно ставить в Плагиатусе, если заказчик ничего не говорит? А так, один требует 4/5, а второй пишет - "как на Адвего, 5/6". Конечно, выгоднее ставить последние, чтобы не извращаться над статьями и не терять их читабельность (пишу для онлайн-журналов).
А какие все-таки нужно? И имеет ли право заказчик предъявить в будущем мне претензии, если, например, его Плагиатус с 4/5 посчитает, что в моем тексте, проверяемом на 5/6, уникальность недостаточна, например, - 92%?
Условия проверки нужно оговаривать с заказчиком. С заказчиками, про которых я написал в пункте 3, работать не нжуно вообще. С заказчиками, которые требуют(!) проверять уникальность 3/3 - работать не нужно.
Я (лично!) думаю, что нормальные параметры это: фраза - 5, шингл - 4.
Можно проверять на 4/4, если при этих параметрах уникальность больше 95%, значит с текстом вс в порядке.
Тем не менее, требование "уникальность 100%", хоть и паранойя, а встречается в огромном количестве заказов. Пусть заказчики не понимают, и авторы тоже так считают, но авторам от этого не легче. С настройками 4/5 я обычно проверяю свои тексты, если другого не требуется, статьи для магазина проверяю с настройками 4/4. Ранее всегда получал уникальность 100%. Сейчас она уже немножко съезжает вниз.
Далее, если Вы считаете, что максимальная уникальность, которую можно требовать 95% - почему бы не закрепить это правилами? Многие заказчики другого мнения! А с новым плагиатусом этот вопрос встает еще более остро.
Сергей, а что за звездочка появляется при копировании текста в программу. Т.е. заголовок программы или ее название в ней принимает вид: Advego Plagiatus 1.2.0.91 *. При дальнейшем копировании другого текста ничего не меняется, но достаточно перезапустить и скопировать текст в поле снова, она появляется. Это для чего?
Уник 4х4: 73, 86, 86, 86, [20:43:32] Ошибка (Ошибка запроса [499]): [ссылки видны только авторизованным пользователям] HEUR:Trojan.Script.Generic Первый раз норма, а дальше троян, но стабильный уник.
Публикация комментариев и создание новых тем на форуме Адвего для текущего аккаунта ограничено. Подробная информация и связь с администрацией: https://advego.com/v2/support/ban/forum/1186