Янв 25

Объявление: снимаю, порчу. Метод автоматического рерайта для больших объёмов.

Проблема в следующем: сайт ВозьмиКредит был обновлён группой фрилансеров методом copy-paste, как результат — неуникальный контент и глубокая пессимизация. Для снятия пессимизации можно заказать рерайт примерно 300 текстов, а можно написать небольшую утилитку.

Заменять одно слово на другое неспортивно, поэтому мы пойдём по более сложному пути. Этот путь похож на алгоритм, который использует Я для сравнения текстов в базе.

Разбиваем текст на блоки по 3 слова, делаем три массива: без смещения, смещение на 1 слово и смещение на 2 слова. Далее по каждому смещению считаем CRC32 строк из 3х слов, сохраняя их в таблицу в формате «3 слова — CRC — количество». Берём самые популярные CRC, придумываем к ним 2-3 строки замены (рерайт), прогоняем по всей базе preg_replace c вероятностью в 20%. Вуаля! Уникальный текст.

written by Жешев \\ tags: , ,

2 комментария to “Кредит: рерайт по технике Яндекса”

Ваш комментарий

Этот блог находят по фразам: