검색 엔진 결과를 테스트하는 방법은 무엇입니까?

인터뷰 질문이 있습니다.

검색 엔진이 대상 쿼리 별 결과가 해당 위치의 요구 사항을 충족하지 않습니다. 어떻게 테스트 하시겠습니까?

어떻게 테스트 하시겠습니까?

하지만 몇 가지 생각이있었습니다.

입력 검색어 목록이 필요합니다.
각 검색어에 대한 타겟 위치가 필요합니다.
각 타겟 위치를 실제 검색어와 일치시킵니다.

하지만 충분하지 않았습니다.

당신을 추가하겠습니다. ' 결과 스 니펫이 표시되거나 쿼리 자동 완성이 작동하는 방식이 아닌 검색 / 순위 알고리즘을 다시 테스트합니다. 둘 다 궁극적 인 검색 효율성에 영향을 미칠 수 있습니다.

답변

저는 검색 엔진 전문가는 아니지만 검색 결과가 표시되는 방식에 영향을 미치는 많은 요인. 쿼리는 본질적으로 시작점이며 엔진이 쿼리를 구문 분석하는 방법이 중요합니다. 또한 일부 검색 엔진은 자연어 알고리즘을 기반으로 쿼리를 “리팩터링”합니다. 반환 된 결과의 순서는 종종 인기도, 일치하는 단어 수, 키워드, 태그 등과 같은 다양한 측정 항목에 따라 달라집니다. 또한 이러한 측정 값 중 일부는 다른 측정 값보다 더 많은 가중치가 부여됩니다.

그래서이 질문은 그 자체로는 충분한 맥락을 제공하지 못하거나이 질문의 목적은 더 많은 맥락을 도출하기 위해 질문하도록하는 것이 었습니다. 때로는 면접관이 모호한 질문을하여 피면 담자가 “어둠 속에서 스탭”을 시작하는지 확인합니다. “충분한 맥락을 얻지 못한 채 (예 : 문제에 부딪 히고 해결책을 찾기를 희망하거나 문제에 대해 생각하고 미리 생각하여 잠재적 인 해결책을 고려).

답변

실제로 검색 엔진 테스트 방법에 대한 질문은 정보 검색 (IR) 문제의 일부입니다. 평가 / 테스트 할 수있는 방법은 거의 없습니다.

기존 IR 접근 방식

기존 IR에서 한 가지 방법은 다음을 포함한 테스트 설정을 준비하는 것입니다.

후보 쿼리
인덱싱 된 페이지의 데이터 세트
각 쿼리에 대한 예상 결과 집합 (예상 순위 포함)

다음으로 후보 쿼리에 대해 검색 엔진을 실행하여 실제 결과를 얻고 정보 검색 메트릭 중 하나를 사용하여 실제 결과와 예상 결과를 비교합니다. , 예 : 정밀도 / 재현율 또는 nDCG . 그러면 예상 결과 집합 (요구 사항)과 관련하여 검색 엔진이 얼마나 나쁜지 정량적 인 대답을 얻을 수 있습니다.

분명히 대답은 상황에 따라 다릅니다. 특히 후보 쿼리의 선택, 의도 및 문구, 인덱싱 된 페이지의 데이터 세트, 예상 결과가 판단되는 방식에 따라 달라집니다. 그렇다면 문맥은 무엇 이었습니까?

목표 기반 / 대화 형 IR 접근 방식

다른 접근 방식, 아마도 더 잠재적 인 사용자를 참여시키고 주어진 쿼리에 대한 결과의 품질을 평가하도록하는 것이 실용적입니다. 그들은 자신의 쿼리를 가져 오거나 쿼리를 정의 할 수 있습니다. 결과 품질에 대해 더 암시적인 피드백을 얻을 수있는 소수의 사람 또는 전체 커뮤니티 일 수 있습니다 (예 : 클릭 한 결과는 예상되는 결과 임).

문제 격리

마지막으로 문제는 검색 엔진의 전반적인 품질을 평가하지 않고 순위가 낮은 이유를 좁히는 것일 수 있습니다. 이 특정 쿼리 결과의. 그래서 나는 당신이 얻은 문제를 따를 것입니다.

대상 검색어에 의한 검색 엔진 결과가 위치에 따른 요구 사항을 충족하지 않는다고 들었습니다.

그리고 스스로에게 물었습니다.

이보다 높은 순위에 오른 다른 결과는 무엇입니까?
왜 순위가 더 높았나요? 결과 스 니펫에서 이것을 알 수 있습니까? 검색어 키워드와 일치하지만 의미가 다를 수 있습니까? 그렇다면 문구가 올바르지 않을까요? 쿼리 의도의 다른 표현이 결과를 향상시킬 수 있습니까?
동일한 검색어가 다르게 표현 될 수 있으며, 동일한 표현이 그 뒤에 다른 검색어 의도를 가질 수 있습니다. 이 검색어에 대한 검색 자의 의도가 무엇인지 정말 알고 있나요?
요구 사항이 정확히 무엇인가요? 더 높은 스폰서 페이지를 높이려면? 아니면 검색어 의도와 일치하는 상위 페이지의 순위를 매기시겠습니까?

다른 유사한 검색어에 대한 문제를 재현하는 데 도움이 될 수 있습니다.

답변

2004 년에 SEO 회사에서 일했습니다.우리의 목표는 Google의 첫 번째 또는 두 번째 페이지에서 타겟팅 된 핵심 구문에 대해 자연 / 자연 검색 결과를 얻는 것이 었습니다 (자연 / 자연 검색 결과는 Google Ad Words에서 후원하는 검색 결과가 아니라 일반 검색 결과입니다). 이 회사는 신생 기업이었고 당시 검색 엔진 시장의 80 % 이상을 차지했기 때문에 Google에만 집중하기로 결정했으며, 연구에 따르면 사용자가 검색 결과 일치를 위해 Google의 처음 두 페이지를 지나치는 경우는 거의 없다는 사실이 밝혀졌습니다.

결과를 테스트 한 방법은 타겟팅 된 핵심 구문 (키워드 조합)을 Google에 입력하고 목록이 Google의 첫 번째 또는 두 번째 페이지에 표시되는지 확인하는 것이 었습니다. 그렇다면 고려 된 것입니다. 성공하지 못했다면 실패로 간주되었습니다.

오늘날 Google의 타겟 광고가 바뀌어 사람들은 다른 컴퓨터에서 다른 결과를받을 수 있으며 Google Plus에 로그인하면 영향을받을 수 있습니다. 결과도 더 이상 테스트 할 수 있을지 모르겠습니다.

그래서 단순히 Google 결과가 참조로 취급되었습니다. == 예상 결과?

답변

질문에 “검색 결과 ult by the query does not meet its requirements by position “, 테스트 목표는 올바른 순위 / 관련성 기반 정렬이 검색 알고리즘에 있는지 확인하는 것 같습니다. 이를 더 디버그 / 드릴 다운하기 위해 쿼리에 대한 자세한 내용을 물어볼 수 있습니다. 단일 필드에 대한 단순한 텍스트 검색이거나 필드 조합을 포함했는지, 영어가 아닌 문자 (분음 부호 등)가 포함되었는지 여부입니다. 결과의 순위가 더 낮은 이유는 검색에서 일부 특수 문자가 생략되었거나 검색에서 해당 필드가 생략되어 일부 특정 필드가 인덱싱되지 않았기 때문일 수 있습니다.

테스트 할 수 있습니다.

추가 필드 조합과 함께 동일한 용어 / 쿼리 사용
히트 맵이 제대로 작동하는지 확인하십시오. 검색 결과의 문서에는 검색된 필드의 다른 문서보다 실제로 더 많은 “검색어 수”가 있습니다. 문서를 열고 계산하면이를 평가할 수 있습니다.
한 번에 하나의 문자를 제거하거나 여러 필드의 경우 하나의 필드를 제거합니다. 필드 검색) 검색 결과가 관련이 있는지 확인한 다음
용어의 동의어를 사용하고 (용어 검색 용) 해당 문서가 더 높은 순위에 있는지 확인합니다.
검색 범위를 좁히십시오. 날짜 또는 다른 필드를 확인하고 축소 된 결과 집합의 순위가 더 높은지 확인합니다.

또 다른 방법은 fiddler 또는 Postman과 같은 도구를 사용하여 검색 API를 호출 한 다음 반환 된 순위를 비교하는 것입니다. UI의 순위. 때로는 일부 캐싱 문제로 인해 클라이언트 쪽 페이지를 구문 분석하고로드하는 동안 정렬이 엉망이 될 수 있습니다.

검색 엔진 결과를 테스트하는 방법은 무엇입니까?

댓글

답변

답변

답변

댓글

답변

답글 남기기 답글 취소하기