Массовое скачивание data:image/png;base64. Не могу скачать картинку

Discussion in 'PHP' started by Archer393, 23 May 2020.

  1. Archer393

    Archer393 New Member

    Joined:
    6 Oct 2016
    Messages:
    8
    Likes Received:
    1
    Reputations:
    0
    Здравствуйте, имеется онлайн библиотека, есть защищенный реадер в ней, покопался в коде в итоге нашел такое:

    [​IMG]

    Как мы видим имеется путь к странице, и получается у всех страниц один и тот же путь, только номер страницы меняется, но если его вставить в строку адресную то идет редирект на главную страницу библиотеки.

    В итоге начал копаться дальше и нашел вот что:

    [​IMG]

    В адресной строке вот такая фигня data:image/png;base64
    Если сохранить правой кнопкой все получается
    Поштучно страницы книги вытаскивать геморрой, есть ли способ как-то все автоматизировать скачку подобных адресов и т.д., кто что может подсказать?
     
    1. Kaimi

      Kaimi Well-Known Member

      Joined:
      23 Aug 2007
      Messages:
      1,732
      Likes Received:
      811
      Reputations:
      231
      Можно попробовать воспользоваться headless chrome и делать скриншоты страниц https://bitsofco.de/using-a-headless-browser-to-capture-page-screenshots/
      Эти же изображения встроены в HTML, скачай HTML представление и спарси содержимое img-тегов.
       
      _________________________
      1. look2009

        look2009 Member

        Joined:
        3 Jun 2009
        Messages:
        80
        Likes Received:
        63
        Reputations:
        5
        Если исходить из запросов ТС с входящими данными, то могу порекомендовать BAS или зенно, для парсинга и извлечения содержимого. По факту скорее стоит токен или js на сайте, отсутствие которого в запросе и редиректит на главную, тут нужно смотреть сайт, всё зависит от размера самой онлайн библиотеки, если уж очень большая то нужно писать софт, если средняя то и BAS хватит. А по сути прежде чем парсить нужно корневой запрос на картинку смотреть.
         
        1. altblitz

          altblitz Elder - Старейшина

          Joined:
          5 Jun 2009
          Messages:
          3,694
          Likes Received:
          3,149
          Reputations:
          236
          Пользовался для скачивания содержания сайтов этой самой программой - кодеров EAC.
          Code:
          Sir Reg - Modern Day disgrace
          Brendan Sheehy - vocals & acoustic guitar
          Karin Ullvin - violin
          Chris Inoue - electric guitar, bass, banjo & backing vocals
          Tommie Faderberg - drums & backing vocals
          Fillip Burgman - mandolin
          
          Guest appearances:
          Erik Ullvin - Piano on #9
          Robin Rönnlund - Mellotron on #2, 3, 4, 5, 8, 10, 11
          
          Produced by Chris Inoue
          Mixed & mastered by Jacob Hansen
          
          All songs writtn by Brendan Sheehy
          Photos by Chris Inoue
          Artwork by Chris Inoue & Andreas
          Layout by Anders Fästader for A Trailermade Production.
          
          Называется оно, столь близко знакомое - не Internet Explorer, и при должной настройке, скачает всё, что угодно и откуда желается.
          И главное, сперва войти на сайт, зарегавшись с плюшками и кукисами, и затем, скачивать содержимое сайта.

          Печалько, что прогу эту многопоточную в инетах нынче не сыскать...