프로젝트에 들어가면 자연어 처리를 너무 아무렇지 않게 요구하는 케이스들이 있다.

그러나 우리가 쓸 수 있는 리소스나 알고리즘, 모델은 보통 자연어 처리를 지원할 정도가 되지 않는다.

이때 간단한 대안으로 제시할 수 있는 것이 레벤슈타인 알고리즘이다.

 

레벤슈타인 알고리즘은 각 String을 2차원 배열로 분리해 글자 차이를 계산해주는 방식이고

패키지로 배포가 되어있다. [UipathTeam.String.Acitivities]

https://hoony-gunputer.tistory.com/entry/%EB%A0%88%EB%B2%A4%EC%8A%88%ED%83%80%EC%9D%B8-%EA%B1%B0%EB%A6%AC%EB%A5%BC-%EC%9D%B4%EC%9A%A9%ED%95%B4%EC%84%9C-%EB%91%90-%EB%AC%B8%EC%9E%A5-%EB%B9%84%EA%B5%90%ED%95%98%EA%B8%B0

 

레벤슈타인 거리를 이용해서 두 문장 비교하기

레벤슈타인 거리를 이용해서 두 문장 비교하기 레벤슈타인 거리는 독일의 레벤슈타인이라는 사람이 고안한 알고리즘이다. 레벤슈타인 거리란 두개의 문장을 2차원 배열로 나타내어서 각 문장

hoony-gunputer.tistory.com

 

보통 해당 사업이 조회하려는 사업이 맞나 같은 것들을 판단해서 공고를 보내주거나 하는 형태로 쓰이고

일치율은 테스트를 통해 조정을 하여 제시하길 바란다. (일반적으로는 40% 내외이나 사안의 유의성에 따라 편차는 클 수 있음.)

+ Recent posts