|
Янв
25
|
Объявление: снимаю, порчу. Метод автоматического рерайта для больших объёмов.
Проблема в следующем: сайт ВозьмиКредит был обновлён группой фрилансеров методом copy-paste, как результат — неуникальный контент и глубокая пессимизация. Для снятия пессимизации можно заказать рерайт примерно 300 текстов, а можно написать небольшую утилитку.
Заменять одно слово на другое неспортивно, поэтому мы пойдём по более сложному пути. Этот путь похож на алгоритм, который использует Я для сравнения текстов в базе.
Разбиваем текст на блоки по 3 слова, делаем три массива: без смещения, смещение на 1 слово и смещение на 2 слова. Далее по каждому смещению считаем CRC32 строк из 3х слов, сохраняя их в таблицу в формате «3 слова — CRC — количество». Берём самые популярные CRC, придумываем к ним 2-3 строки замены (рерайт), прогоняем по всей базе preg_replace c вероятностью в 20%. Вуаля! Уникальный текст.
2 комментария to “Кредит: рерайт по технике Яндекса”
-
Текст скрыт
-
Текст скрыт
Ваш комментарий
Этот блог находят по фразам:












