3WiFi объединенная база логов Router Scan

Discussion in 'Беспроводные технологии/Wi-Fi/Wardriving' started by akokarev, 13 Jul 2015.

?
  1. Бесплатным для всех

    998 vote(s)
    62.7%
  2. Платным для неактивных участников

    189 vote(s)
    11.9%
  3. База свободна для скачивания

    209 vote(s)
    13.1%
  4. База доступна для просмотра на сайте, но не для скачивания

    322 vote(s)
    20.2%
  5. Нужна оффлайн шифрованная база для 3WiFi Locator

    136 vote(s)
    8.5%
  6. Обязательная регистрация на сайте

    457 vote(s)
    28.7%
  7. Регистрация только по приглашениям

    185 vote(s)
    11.6%
  8. Ограничения на просмотр согласно рейтинга участников

    70 vote(s)
    4.4%
  9. Проект нужно закрыть, базу удалить

    21 vote(s)
    1.3%
Multiple votes are allowed.
  1. TOX1C

    TOX1C Elder - Старейшина

    Joined:
    24 Mar 2012
    Messages:
    1,135
    Likes Received:
    1,931
    Reputations:
    24
    Обходится очень легко - грузится старая база, которую здесь же и достать можно. RouterScan Log, или скан диапазона укртелекома. Там больше 3000 точек. Старые данные? Пох, главное доступ к базе получен, то что юзер немножко нагадил, так это даже хорошо, ибо не фиг жлобиться) Вспомни как на торрентах обходили рейтинг.
    3000 новых точек? Попробуй сам столько собрать. А когда не выйдет, можно сгенерировать фейковых точек и залить в базу. Зачем? Читай выше.
    Удалить базу надо тогда. Только так не сольют. Если есть ограничение на что-то, и есть желающий это получить, он получит его. Есть торрент трекеры с инвайтами, и люди платят за них. Не сильно "илтный" трекер - 10 баксов, очень "илитный" - 200 баксов. Для массового юзера на таких трекерах мало чего интересного, слив барахла в публику ничего ужасного не делает, только жопы завсегдатаям трекера поджигает.
    Так вот, чем сильнее ограничивать, тем быстрее найдется желающий слить, чисто из принципа. И будут желающие платить за слитые данные, за тот же оффлайн, который честным путем не получить.
    Слить базу и сейчас можно, в полуавтоматическом режиме спарсить данные с карты.
    Вообще, к базе следует относиться так, как будто ее уже слили. Потому что ее сольют, рано или поздно.

    Ну допустим, ввели ограничение на доступ к базе после 3к точек, регу, инвайты, ограничение на запросы и т.д. и вдруг базу в лучшем случае сливают в паблик, пополнив словари для брута и базы телефонного спама. В худшем, хитрый барыга, пользуясь базой с ограниченным доступом, пилит софт для плей маркета, угрожая халявным вайфаем везде и всюду, и стрижет зелень "за воздух" или откручивает рекламу. Делая за бабло то, что "официальный" разработчик не хочет делать. Хитрый барыга стрижет бабло и ни за что не отвечает, мопед не его, участники основного проекта унижены и обижены, как же так, кто-то продает их данные. Почему так произошло? Ну хз.
    ***
    Едем дальше, о данных, офлайне, регистрациях и прочем.
    Нужно добавить в проект список провайдеров с их диапазонами. Наилучшим вариантом будет база автономных систем. Зачем? Читаем дальше.
    1) Почистить из базы ip роутеров, заменить это на AS провайдера. Так как в половины случаев это динамические ip, они уже не актуальны.
    2) Навести порядок в статистике. Положить конец комменту none и RouterScan, точки после загрузки автоматически добавляются в копилку к провайдеру
    Переделать страницу статистики, вместо невнятной путаницы сделать таблицу типа ASN - Имя провайдера - кол-во точек - последнее обновление - коммент.
    По тыку на провайдера открывается кушабельный список диапазонов ip для скана + история комментов.
    вот вам и идея с форумом + проверкой актуальности + распределением нагрузки.
    На роутеры в локалке пока что положим болт, будет чисто по комменту сортировка.
    теперь о юзерах - публика, движимая целью поиска шарового инета, ходит без логина по общему паролю, может выгрузить базу по провайдеру, городу (в киент 3wifi например). База из 4 полей - мак, имя сети, пароль, впс пин. + Возможно координаты, если будет локация по типу wifi map. Для доступа к халяве хватит.
    При скане сети, и загрузки лога на сайт, может вписать что-то в коммент, этот коммент появится в статистике по прову.
    Зареганный юзер может все то же + скачать свои логи + выгрузить базу целиком (без ip адресов и данных авторизации, но с прописанным диапазоном провайдера), для анализа паролей например, или поиска алгоритма wps pin + добавлять коммент к диапазонам без необходимости залития лога скана (чтобы уведомить о мусорных диапазонах: сети хостеров, пустых диапазонах и т.д.), менять имена диапазонов (в базе AS провайдеры бывают вписаны как FOP Ivanov Ivan, и есть смысл переименовать это во что нибудь понятное, типа ЛохНет, Москва, как теперь в комментах пишут).
    ***
    пысы: шифрование офлайн базы никак не защитит, есть файл с хешами, есть алго хеширования, откуда и какие данные брать для хеширования, есть plaintext в виде онлайн точек на сайте. Пилится скрипт, который тянет инфо точек с карты, хеширует их, сравнивает с тем, что есть в базе, и при попадании меняет хеш на чистые данные.
    и так база дешифруется.
     
    #681 TOX1C, 25 Nov 2015
    Last edited: 25 Nov 2015
    erwerr2321 and Triton_Mgn like this.
    1. CRACK211

      CRACK211 Elder - Старейшина

      Joined:
      16 Sep 2009
      Messages:
      1,045
      Likes Received:
      1,127
      Reputations:
      11
      нашел свой новый роуутер в базе) решил посмотреть на сколько точно определяются точки на карте. Точка отображается на углу соседнего дома)ну думаю наверно не точно определилась на карте. думаю ладно и так нормально. А сегодня иду домой мимо того соседнего дома где отображается мой роутер и вижу такую картину молодой пацан лет 16 крутит у себя на болконе мощную wifi антену)и тут меня осенило а случайно ли мой новый роутер определился в этом доме?) посмотрел историю а там один мас не мой)я так понимаю на карте не сами роутеры находятся, а устройства к ним подключенные)Или это совпадение)
       
      #682 CRACK211, 25 Nov 2015
      Last edited: 25 Nov 2015
      1. binarymaster

        binarymaster Elder - Старейшина

        Joined:
        11 Dec 2010
        Messages:
        4,717
        Likes Received:
        10,195
        Reputations:
        126
        Не совпадение, беспроводные клиенты под управлением Android, iOS, и другие также используются для определения геолокации новых точек.

        Где-то выше в этой же теме мы говорили об этом.
         
        1. akokarev

          akokarev Well-Known Member

          Joined:
          6 Dec 2012
          Messages:
          164
          Likes Received:
          309
          Reputations:
          7
          [​IMG]
          Удалось посмотреть на кластеризацию в максимальном удалении, но грузит ужасно долго и подозреваю, что данные не совсем корректны.
           
          hahanovB, Payer and binarymaster like this.
          1. CRACK211

            CRACK211 Elder - Старейшина

            Joined:
            16 Sep 2009
            Messages:
            1,045
            Likes Received:
            1,127
            Reputations:
            11
            Уже на картах Navteq можно посмотреть?)это на максимально удалении navteq появляется )
             
            1. akokarev

              akokarev Well-Known Member

              Joined:
              6 Dec 2012
              Messages:
              164
              Likes Received:
              309
              Reputations:
              7
              Нашел узкое место: тормозит запрос
              SELECT COUNT(*) FROM `GEO_TABLE`...
              Ищу способы как ускорить. Может попробовать MS SQL? Пишут там с этим нет проблем.
              Еще нужно сделать привязку секторов к тайлам, иначе рассинхрон запросов и как следствие невозможность закэшировать запрос.
              Кто такая Navteq? Я только с Яндексом дружу. Смотрю еще в сторону OpenStreetMaps, видел там тепловую карту можно сделать - здорово выглядит!
               
              1. CRACK211

                CRACK211 Elder - Старейшина

                Joined:
                16 Sep 2009
                Messages:
                1,045
                Likes Received:
                1,127
                Reputations:
                11
                В правом нижнем углу) карты)на скриншоте
                https://ru.m.wikipedia.org/wiki/Navteq
                 
                1. binarymaster

                  binarymaster Elder - Старейшина

                  Joined:
                  11 Dec 2010
                  Messages:
                  4,717
                  Likes Received:
                  10,195
                  Reputations:
                  126
                  А если переедем на *nix хост?

                  И по-моему SELECT COUNT(BSSID) FROM `GEO_TABLE` будет немного быстрее.
                  Ещё Fusix говорил, что делать запросы в цикле - не оптимально.
                   
                  1. akokarev

                    akokarev Well-Known Member

                    Joined:
                    6 Dec 2012
                    Messages:
                    164
                    Likes Received:
                    309
                    Reputations:
                    7
                    Незначительная разница есть:
                    SELECT COUNT(*) FROM `GEO`, `BASE` =27,581 sec.
                    SELECT COUNT(`GEO`.`BSSID`) FROM `GEO`, `BASE` WHERE =26,552 sec.
                    SELECT COUNT(`BASE`.`BSSID`) FROM `GEO`, `BASE` WHERE =28,470 sec.
                    //(`latitude` != 0 AND `longitude` != 0) AND (`latitude` BETWEEN 1 AND 90 AND `longitude` BETWEEN 1 AND 90) AND `BASE`.`BSSID` = `GEO`.`BSSID`
                    Если убрать (`latitude` != 0 AND `longitude` != 0) то выиграем еще 0,1 sec.
                    Переставим условия местами и выиграем еще 0,6 sec.
                    Можно объединить запросы в один, чтобы от цикла избавиться, но это тормозит сам запрос вместо 27,581 sec получаем 29,266 sec.
                    SELECT
                    (SELECT COUNT(*) FROM `GEO`, `BASE` WHERE
                    `BASE`.`BSSID` = `GEO`.`BSSID`
                    AND (`latitude` BETWEEN 1 AND 45 AND `longitude` BETWEEN 1 AND 45)) 'c1',
                    (SELECT COUNT(*) FROM `GEO`, `BASE` WHERE
                    `BASE`.`BSSID` = `GEO`.`BSSID`
                    AND (`latitude` BETWEEN 1 AND 45 AND `longitude` BETWEEN 46 AND 90)) 'c2',
                    (SELECT COUNT(*) FROM `GEO`, `BASE` WHERE
                    `BASE`.`BSSID` = `GEO`.`BSSID`
                    AND (`latitude` BETWEEN 46 AND 90 AND `longitude` BETWEEN 1 AND 45)) 'c3',
                    (SELECT COUNT(*) FROM `GEO`, `BASE` WHERE
                    `BASE`.`BSSID` = `GEO`.`BSSID`
                    AND (`latitude` BETWEEN 46 AND 90 AND `longitude` BETWEEN 46 AND 90)) 'c4'
                    Можно еще предварительно скомпилированные запросы использовать (как раньше было), но думаю прирост будет незначительный, если будет.
                    На счет смены платформы на *nix, думаю толку от этого особо не будет.
                    Есть такие идеи:
                    1. привязать границы секторов к тайлам, тогда кэширование будет срабатывать.
                    2. добавить еще одну таблицу - кластеры, и на каждый зум потайлово их формировать. Сложность в том, что при любом изменении в BASE, нужно будет пересчитывать соответствующий тайл\кластер.
                    3. Использовать quadkey. Это автоматически сделает привязку к фиксированным областям, а значит позволит кэшировать запросы, а также ускорит поиск кластеров (там можно искать по маске). Это лучший вариант, но надо много править касаемо вычисления координат. Хорошую статью на эту тему предлагали здесь на форуме.
                     
                    #689 akokarev, 26 Nov 2015
                    Last edited: 26 Nov 2015
                    binarymaster likes this.
                    1. binarymaster

                      binarymaster Elder - Старейшина

                      Joined:
                      11 Dec 2010
                      Messages:
                      4,717
                      Likes Received:
                      10,195
                      Reputations:
                      126
                      F8:C0:91:12:88:54

                      Интересный факт... в WIFIMAP есть пароли, у которых обрезаны нули, но не ведущие, а завершающие.
                       
                      1. Fusix

                        Fusix Active Member

                        Joined:
                        11 Nov 2011
                        Messages:
                        74
                        Likes Received:
                        224
                        Reputations:
                        2
                        Может быть они превеженцы Little-endian?)
                         
                        #691 Fusix, 26 Nov 2015
                        Last edited: 26 Nov 2015
                        1. akokarev

                          akokarev Well-Known Member

                          Joined:
                          6 Dec 2012
                          Messages:
                          164
                          Likes Received:
                          309
                          Reputations:
                          7
                          Возможно 123000...000 превратилось в 123е20, затем в строку "123e20", затем из строки в число, но "e20" воспринялось как текст и отбросилось. А может просто хранили в перевернутом виде 000..0321
                           
                          1. Fusix

                            Fusix Active Member

                            Joined:
                            11 Nov 2011
                            Messages:
                            74
                            Likes Received:
                            224
                            Reputations:
                            2
                            Вот тайлы было бы интересно, а именно разбить GEO на пару десятков таблиц. Сейчас при поиске базе приходится бегать через кучу не нужных точек с другого конца света, что замедляет. Реализовать функции GetTailFromCoord чисто арифметическими способами можно. Звучит интересно...
                             
                            1. akokarev

                              akokarev Well-Known Member

                              Joined:
                              6 Dec 2012
                              Messages:
                              164
                              Likes Received:
                              309
                              Reputations:
                              7
                              Немного переделал, сам код карт будет запрашивать потайлово, каждый тайл=сектор. Цикл убрал. Вроде пошустрее работает, после небольшой буферизации. По началу зависает, приходится карту перезагружать. Но после 3-5 минут прокруток, перезагрузок, вполне сносно работает.
                              http://rghost.ru/6XQv9Zfpj
                              Но боюсь придется отключить демон геолокации, а может вовсе все демоны. А то кэш будет быстро устаревать.

                              Как вариант, часть работы можно переложить на PHP (в базе запрашивать только тайлы размером 1,3,5,7, а на приближении 2,4,6,8 обрабатывать пыхом предыдущие результаты).
                              Еще можно запретить некоторые уровни зума - меньше разнотипных запросов к базе, меньше кэш.

                              Не совсем понял про GetTailFromCoord, думаю все-таки quadkey вместо lat lon будет лучше.
                               
                              1. binarymaster

                                binarymaster Elder - Старейшина

                                Joined:
                                11 Dec 2010
                                Messages:
                                4,717
                                Likes Received:
                                10,195
                                Reputations:
                                126
                                Новости проекта:
                                (актуально для тех, кто не следит за коммитами)

                                1. Поиск точек: если IP точки локальный - диапазон будет показан по полю WAN IP
                                2. Поиск диапазонов: теперь задействует оба поля - IP и WAN IP
                                3. Статистика DNS: теперь учитываются все три столбца (раньше только по первому)
                                4. Статистика общая: добавлен вывод уникальных BSSID, а также состояние заданий
                                5. Загрузка в базу: добавлена подсказка комментариев

                                В списке TODO ещё полно всего, я помню обо всём :)
                                 
                                1. Payer

                                  Payer Elder - Старейшина

                                  Joined:
                                  14 May 2010
                                  Messages:
                                  1,061
                                  Likes Received:
                                  5,202
                                  Reputations:
                                  63
                                  Подскажите, порт 61080 откуда взялся?
                                  Может в статистику устройств добавить колонку порта?
                                  А то непонятно какие устройства на каких портах ловить. Вот мне именно 61080 ни разу не попадался.
                                   
                                  1. binarymaster

                                    binarymaster Elder - Старейшина

                                    Joined:
                                    11 Dec 2010
                                    Messages:
                                    4,717
                                    Likes Received:
                                    10,195
                                    Reputations:
                                    126
                                    IP-адреса Болгарии, устройства в большинстве случаев TP-LINK TL-WR740N.
                                     
                                    Payer likes this.
                                    1. AnonimZero

                                      AnonimZero New Member

                                      Joined:
                                      23 Nov 2015
                                      Messages:
                                      8
                                      Likes Received:
                                      2
                                      Reputations:
                                      0
                                      Встречаются ещё в Японии, Ю.Корее и много в Китае)
                                       
                                      Payer likes this.
                                      1. akokarev

                                        akokarev Well-Known Member

                                        Joined:
                                        6 Dec 2012
                                        Messages:
                                        164
                                        Likes Received:
                                        309
                                        Reputations:
                                        7
                                        Смотрел тут WiFi map... Платные города сливаются на раз-два! Только времени уходит много на тыкание скачать, скачать, скачать...
                                        Ну да ладно. База в sqlite, все данные как-то хитро разбиты на таблицы со ссылками друг на друга по I'd. В принципе, собрать воедино можно. Чуть было не занялся этим, но решил сначала посмотреть в самой пороге, что же за пароли в базе?! А пароли сплошной спам! То какие-то пасылы типа 'naui idi', то явно не валидные '123', то комментарии 'самое лучшее кофе в городе', куча повторов...
                                        В общем, если взять Москву, то у нас на карте в 10 раз больше точек, данные более чистые и верные. В целом у нас 1кк точек, у них 2кк мусора.
                                        Удалил WiFi map навсегда, мне такое и даром не надо! И в 3wifi базу лить не советую, а ещё лучше удалить все что имеем в базе с этим комментарием.
                                         
                                        1. Triton_Mgn

                                          Triton_Mgn Elder - Старейшина

                                          Joined:
                                          6 Jul 2015
                                          Messages:
                                          3,673
                                          Likes Received:
                                          5,775
                                          Reputations:
                                          51
                                          "
                                          Это было давно понятно, так как скачав их приложение и через 4pda обмануть приложение, что ты его купил посмотрев на точки в своем городе, полный фейк. В принципе есть наверно люди купившие это приложение, но!! Google play вроде как выдал систему отказа от покупки приложения в течении 5 суток, если не изменяет память, на любое приложение, будь то игра.. Теперь разработчики пользуются донатом- приложение бесплатно, и вернуть нечего. Проект Придуманный Вами, явно не входит в интерес людей заработать на этом, что радует, и вливают все более новые,актуальные данные. Так держать. Поэтому я за защиту базы. Если базу и открывать, вы должны понимать, что ей не будут торговать не на "черном рынке", а выведут ее на тот же Google Play/ и заработают на этом деньги, считай за наш счет- труды, с таким же интересом - если вдруг база будет открыта, стоит прежде самам подумать о платном приложении, чем давать нахлебникам пользоваться, а мы за Вас порадуемся, хоть какие-то денежки для стимула, развивать проект. И вопрос, голосование выше каким будет - бессрочный?
                                           
                                          #700 Triton_Mgn, 27 Nov 2015
                                          Last edited: 27 Nov 2015