Система состоит из нескольких скриптов - скачивает фото юзеров из профилей ВК в рамках одного указанного города, и создает базу биометрических данных этих лиц, связывая их с аккаунтами ВК.
Скрипты протестированы на Parrot OS и требуют установки модулей Python которые есть в разделах import у скриптов
Для того чтобы скрипты заработали клонируйте этот репозиторий и удалите из подкаталогов файлы README.MD - иначе они будут мешать работе скриптов
Скачайте этот файл Для просмотра ссылки необходимо: Войтиили Зарегистрироваться и бросьте в папку с проектом
По итогам работы скрипта вы получите файлик ids.txt со списком ID ВК
Имена файлов ссответствуют id ВК
Тем не менее его можно выключить в любой момент а при следующем запуске он начнет с того места где остановился
Данный скрипт ищет очень медленно из-за того что ему нужно перебрать все файлы .npy
Не рекомендуется использовать данный способ для поиска - только для проверки корректности создания .npy
Помимо этого создается файл associations.txt в котором хранятся соответствия номеру записи в эмбединге и имени файла .npy из которого она была взята
В отличии от скрипта номер 4 работает очень быстро.
Скрипты протестированы на Parrot OS и требуют установки модулей Python которые есть в разделах import у скриптов
Для того чтобы скрипты заработали клонируйте этот репозиторий и удалите из подкаталогов файлы README.MD - иначе они будут мешать работе скриптов
Скачайте этот файл Для просмотра ссылки необходимо: Войти
- VkIdsParser_1.py - впишите в скрипт ваш логин пароль ВК (с выключенной двухфакторной авторизацией)
По итогам работы скрипта вы получите файлик ids.txt со списком ID ВК
- DownloadPhotosToJpg_2.py - впишите в скрипт ваш логин пароль ВК (с выключенной двухфакторной авторизацией)
Имена файлов ссответствуют id ВК
- JpgToNpy_3.py - Производит процесс сбора биометрических параметров лиц с фото в папке jpg и сохраняет их в паку npy в виде мелких файликов
Тем не менее его можно выключить в любой момент а при следующем запуске он начнет с того места где остановился
- FindIntoNpy_4.py - скрипт пытается найти среди файлов .npy в папке npy биометрию схожую с 1.jpg
Данный скрипт ищет очень медленно из-за того что ему нужно перебрать все файлы .npy
Не рекомендуется использовать данный способ для поиска - только для проверки корректности создания .npy
- NpyToEmbeddingsBin_5.py - скрипт берет все файлы .npy из папки npy и создает на их основе файл embeddings.bin
Помимо этого создается файл associations.txt в котором хранятся соответствия номеру записи в эмбединге и имени файла .npy из которого она была взята
- FinfFaceInEmbeddingsBin_6.py - пытается найти в базе лицо схожее с лицом на 1.jpg
В отличии от скрипта номер 4 работает очень быстро.