SMParser II
Не писал в блоге, наверное, уже тысячу лет, пора уже видимо чем-либо разродиться. На сей раз это усовершенствованный парсер яндекс весны имеющий нормальный гуи, кучу настроек и наскоро сделанный синонимайзер на 20 тысяч слов. Первая версия была тут, кому интересно могут и ее скачать. На самом деле логика почти не претерпела изменения, а вот гуи заняло около 90 % работы над этим скриптом.
SMParser функционал
- парсить рандомные и конкретные тематики
- появились настройки форматирования текста
- использовать прокси
- на ходу синонимизировать текст
Общий вид софтины

Настройки
Количество текстов - определяет сколько текстов надо спарсить
Ширина строки - определяет ширину строки текста записываемого в файл
Пробелы после H1 - если стоит галка "Заголовки текстов", можно указать отступы после них
Пробелы после P - дефолтная статья имеет три параграфа, здесь можно указать их отступы
пробелы после текста - пробелы после текста ))
Заголовки текстов - если галка стоит собираются еще и заголовки, если нет текст идет сплошняком
Рандомные темы - для парсинга выбираются случайные темы, иначе есть блок правее где можно указать необходимые
Синонимизировать - синонимизирует текст встроенной базой синонимов
Перезаписывать файл - если задаются рандомные темы или выбранно больше 2-х тем то файл с текстами будет иметь префикс mix_data, если выбрана одна тема файл будет иметь ее название, например: literature_16.01.10.txt. Так вот если вы хотите что бы эти файлы перезаписывались каждый раз при начале парсинга ставьте галку.
Использовать прокси - При каждом запросе программа будет брать случайное прокси из файла. Использует прокси из файла /resurs/proxy.txt . Если хотите указать свои прокси указывайте из в файле proxy_for_chek.txt и нажимайте кнопку проверка прокси.
Потоков для проверки прокси - указывайте количество, если проксей много то лучше по больше, хотя я сознательно ограничил максимальную планку потоков, дабы не получать бан от сайта по которому они проверяются )
Таймаут для прокси - как написанно так и есть
Задержки в запросах - время в секундах, через которое будет производиться следующий запрос.
Вот собственно и все.
Скачать SMParser можно .
Обсуждать, жаловаться, предлагать здесь



А откуда парсит?
C Яндекс рефератов?
Точно, парсит именно с них.
Сколько живут такие доры?
Был даже такой дорогенератор онлайн (по моему Барыкина). Сам парсил, сам заливал на народ, только и ссылок своих добавлял.
Доры это совокупность кучи факторов, и текст один из них. С одним и тем же текстом может быть и в бане и в индексе. На народе вообще доры дохнут как мухи. Размещать там вообще нет смысла.
Парсер - очередной инструмент чтобы быстро сделать текст.
Спасибо! Отличный софт
Отличная утилита, как раз нужно было что-то подобное. Списабо, SeoMazzi.
Спасибо за такую отличную программу. Еще бы добавить нарезку файлов по количеству символов так вообще бы цены не было.
Или еще лучше по количеству статей, символов и строчек. Разбивку по статьям вообще не сложно сделать. Ждем обновлений
Что значит по количеству символов? Символов где?
Так же не вполне понятно каким образом надо разбивать по текстам.
“каким образом надо разбивать по текстам.”
а вот для WordPress’a подойдет DreamWeaver с его авто заменой, а для непосредственного разбиения на статьи TextKit (последнее кто ломанёт премиум версию буду благодарен =))
Большое человеческое спасибо.
А то тут два домена застоялись - а тут и считай текст поспел.
у меня в доступ интернета стоит bad хотя с инетом все норм…..
Обсуждения на форуме.
Комментарии закрыты.