Разместите свой проект бесплатно и начните получать предложения от фрилансеров-исполнителей уже спустя минуты после публикации!

Парсинг сайтов primamedia и invest.primorsky.ru на Python



  1. 730    24  2   1
    7 дней10 000 ₽

    Приветствую!

    Заинтересовал ваш проект. С каких новостных сайтов нужно сделать подсчёт и как много слов?

    Предлагаю обсудить детали в личной переписке для уточнения сроков и стоимости.

  2. 567    11  1   1
    4 дня5 000 ₽

    Примерный объем работы поссчитала. Готова обсудить детали проекта и ключевые слова в лс. Нужно будет еще хранить текст статей локально для поиска частоты вхождений.

  3. 311    1  0
    5 дней5 200 ₽

    Приветствую.
    Могу разработать движок по ваши потребности. Добавить логику, если надо можно легкие графики вставить.
    Обращайтесь, буду рад помочь.

  4. 177    3  1
    8 дней30 000 ₽

    Я делаю такую работу постоянно. Напишите в личные сообщения, я дам ссылку на примеры таких работ.

  5. 330  
    3 дня2 500 ₽

    Здравствуйте. Знаком с парсингом достаточно давно. Смогу выполнить данную задачу за 3 дня. Пишите, буду рад FeedBack'у

  6. 237    5  1
    4 дня7 000 ₽

    Здравствуйте, готов написать программу на яп Pyhton(requests + BeautifulSoup), цена за два сайта, за качество программы ручаюсь, пишите)

  • Элина Шишканинец
    28 апреля в 07:16 |

    Здравствуйте, я так понимаю алгоритм такой. Заходим на сайт в раздел новостей(https://invest.primorsky.ru/ru/news), парсим новости и выводим частотность по словам из каждой новоти. А у вас сервер есть для питона или будете на локальной машине запускать?

  • Элина Шишканинец
    28 апреля в 07:19 |

    но для начала нужно сформировать массив вида={сайт,дата, текст_статьи }

  • Наталья Зуйкова
    28 апреля в 07:21 |

    Добрый день! Нужна общая частотность предложенных слов за квартал (например там 100 новостей и слова из словаря встречаются 150 раз). Запускаться, к сожалению, будет на локальной машине.

  • Элина Шишканинец
    28 апреля в 07:24 |

    imageдля этого сайта, я проверила можно спарсить 334 новости. То есть список слов нужо будет сравнить с таким количество, либо за квартал? но квартал формируется исходя из заданной даты? года

  • Наталья Зуйкова
    28 апреля в 07:29 |

    эти 334 новости разделяем на стандартные кварталы (явн, февр, март) и в них подсчитываем, сколько раз встречаются ключевые слова в общем (не каждое по отдельности, а общее количество)

  • Элина Шишканинец
    28 апреля в 07:29 |

    imageа на этом сайте 16*293=4688 новости. Именно  с этим сайтом будет больше всего работы

  • Наталья Зуйкова
    28 апреля в 07:30 |

    да, этот сайт гораздо объёмнее

  • Элина Шишканинец
    28 апреля в 07:31 |

    всего нужно будет совершить 5022 прохода по сраницам сайтов. Возможно понадобятся прокси

  • Андрей Л.
    29 апреля в 00:36 |

    вам не надо обход всех страниц. 

    нужен алгоритм выборки по дате. из data-set и формирование отчета. я так думаю))

  • Элина Шишканинец
    29 апреля в 01:35 |

    нам ведь нужен текст каждой новости, поэтому проход неизбежен