사전의 배열; 각 {key, value} 쌍 비교; 사전 및 결합

Question

배열의 요소를 비교하는 중첩 for 루프를 최적화하려고합니다. 배열의 나머지 요소와 함께 .

두 부분이 있습니다. 첫 번째 부분은 예를 들어 배열에 3 개의 요소가 있고 각각 요소는 사전입니다.

[{"someKey_1":"a"}, {"someKey_1":"b"}, {"somekey_1":"a"}]

1 차 반복 (첫 번째 요소는 두 번째 요소와 비교) :

“someKey의 테스트 키 “두 요소의 경우 a != b 이후로 아무것도하지 않습니다

두 번째 반복 (첫 번째 요소는 세 번째 요소와 비교) :

두 요소에 대해 “someKey”의 키를 테스트합니다. a == a 이후 몇 가지 논리를 수행합니다.

코드 (Sudo) :

for idx, first_dictionary in enumerate(set_of_pk_values): for second_dictionary in (set_of_pk_values[idx+1:]): if (first_dictionary["someKey"] == second_dictionary["someKey"]): #Some Logic

코드의 #Some Logic 부분에는 한 사전에서 다른 사전으로 키를 결합해야합니다. 예 :

for key in val_2.keys(): val[key]=val_2[key]

코드 :

newList = [] skipList = [] checked = [] getter = itemgetter("predecessor") getter_2 = itemgetter("setid_hash") for idx, val in enumerate(set_of_pk_values): if(idx not in skipList): for val_2 in set_of_pk_values[idx+1:]: if(idx not in checked): try: if (ast.literal_eval(getter(val)) == ast.literal_eval(getter(val_2))): for key in val_2.keys(): if(key != "block" and key != "username" and key != "setid" and key != "setid_hash" and key != "predecessor" and key != "time_string" and key != "condition"): val[key]=val_2[key] skipList.append(idx) except: if (getter(val) == getter(val_2)): for key in val_2.keys(): if(key != "block" and key != "username" and key != "setid" and key != "setid_hash" and key != "predecessor" and key != "time_string" and key != "condition"): val[key]=val_2[key] skipList.append(idx) checked.append(idx)

샘플 입력 (set_of_pk_values) :

Answer 1

`ast.literal_eval(...)`

루프의 실행 시간이 상당히 줄어들 것입니다. 하지만 왜 우리가 이것을 제거 할 수 있습니까? 고려 사항 :

 m = "[0, 1, 2, ... , 9,999]" # a str representation of list w/ 10k elements, 0-9999 n = "[0, 1, 2]" x = ast.literal.eval(m) y = ast.literal.eval(n) x == range(10000) # true

위의 스 니펫에서 볼 수 있듯이 ast.literal_eval(...)는 전달하는 모든 문자열을 구문 분석하고 평가합니다. 그리고 해당 문자열의 리터럴 표현을 반환합니다 (물론 문자열이 유효한 리터럴을 나타낸다고 가정). 분명히 m와 n를 비교하는 것이 x를 비교하는 것보다 더 효율적입니다. 및 y. 또한 val 또는 val_2가 유효한 파이썬 리터럴인지 여부에 대해 우려하지 않는 것 같습니다. ast.literal_eval(...) 예외가 발생하면 기본적으로 getter(val) 및 getter(val_2)에서 반환 된 문자열을 비교합니다. . 간단히 말해서 try: / except:를 제거하고 except 절에있는 문장을 사용할 수 있습니다.

`for key in val_2.keys()`

위의 루프는 두 루프 1 및 2. 반복 할 때마다 key가 가능한 다른 7 개의 키 값과 동일하지 않은지 확인합니다. 이러한 키 값 중 6 개는 귀하가 제시 한 데이터에서 발생하고 7 번째 (condition)는 그렇지 않습니다.다음으로 바꾸는 것이 더 효율적이어야합니다.

for key in val_2.keys(): if(key != "block" and key != "username" and key != "setid" and key != "setid_hash" and key != "predecessor" and key != "time_string" and key != "condition"): val[key]=val_2[key]

다음으로

# put this at the top of the test function x_keys = set(["block", "username", "setid", "setid_hash", "predecessor", "time_string", "condition"]) # ... for key in set(val_2.keys()) - x_keys: val[key] = val_2[key]

사전의 키 값 쌍 내에있는 문자열을 문자 그대로 표현했습니다. 생각해 보면 키, 값 쌍을 먼저 변경하려고 시도하는 for 루프를 작성할 수있었습니다. 그런 다음 ‘ 나중에 ast.literal_eval을 테스트 할 필요가 없습니다. 이는 20 초에서 밀리 초로 상당한 속도 향상을 가져 왔습니다.

사전의 배열; 각 {key, value} 쌍 비교; 사전 및 결합

Answer

`ast.literal_eval(...)`

`for key in val_2.keys()`

댓글

답글 남기기 답글 취소하기