Jump to content
Compvision.ru
Sign in to follow this  
mrgloom

"хэш функция" для изображения

Recommended Posts

вообщем понадобилось искать точную копию изображения в очень большой базе картинок(просто лежат по папкам), как это можно сделать быстро?

т.е. интересует как сделать "уникальный ключ" картинки и как потом всё это организовать(дерево?), чтобы искать быстро.

можно тут применить sha1, md5?

хотя может этим не заморачиваться, а сделать сразу хотя бы чтобы учитывался кроп, скейл, т.е. была какая либо инвариантность.

готовое решение на питоне приветствуется.

Share this post


Link to post
Share on other sites

всё оказалось довольно легко

>>> import hashlib

>>> from PIL import Image

>>> img= Image.open('C:/1.png')

>>> img_hash= hashlib.md5(img.tostring()).hexdigest()

остальные вопросы пока остаются.

Share this post


Link to post
Share on other sites
import os

import hashlib

import glob

from PIL import Image

os.chdir("C:/test") #put path to param

main_dir= os.getcwd()

dir_list=[d for d in os.listdir(os.getcwd()) if os.path.isdir(d)] #too complicated but work

img_hash_list= []

for dirs in dir_list:

curr_path= main_dir+'\\'+dirs

os.chdir(curr_path)

for files in glob.glob("*.png"):

full_path= curr_path+'\\'+files

img= Image.open(full_path)

img_hash_list.append(hashlib.md5(img.tostring()).hexdigest())

print img_hash_list

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now

Sign in to follow this  

  • Recently Browsing   0 members

    No registered users viewing this page.

×