각 시스템별로 Data Export를 하는 것을 받아보면 여러가지 형태가 있다.

xls, xlsx, csv, txt 등등 각 서버마다 DB최적화를 위해서든, 사용자 편의를 위해서든 데이터를 주는 방식이 다르다.

혹은 OCR로 데이터를 읽었더니 Structured Text가 생기고 이를 의미단위로 나누어 처리해야 되는 케이스들이 생긴다.

 

RPA로 이런 데이터를 다루기 위해서, 특히 DataTable에 넣기 위해서는 다음과 같은 방법이 있다.

 

1. Generate Data Table

 - OCR의 구조화된 텍스트를 읽기 위한 방식이지만 Amazon같이 txt로 뱉어주는 곳에서 유용하게 쓸 수 있다.

 - 규칙적으로 나누다보니 변칙적인 데이터가 있는 경우(구분자나 문법에 관련된 문자열이 데이터 자체에 포함된 경우) 문제가 생길 수 있다.

 - 일반적으로 chr(34)를 Replace하고 Input에 넣어야 잘 작동한다.

 - 특이한 데이터의 경우 Environment.NewLine(chr(10)+chr(13))이 아닌 Chr(10)으로 row가 나뉘거나, 이상한 Tab으로 컬럼이 나뉘기도 한다.[이럴 땐 그 탭을 복사해서 컬럼 구분자로 넣어줘야 함]

 - 일률적이지 않을 수 있으므로 잘 구조화된 텍스트가 아니라면 다른 방법을 먼저 시도하길 권한다. [웬만해선 CSV 체크를 하면 잘 되긴 한다.]

2. Ctrl+a 후 엑셀에 붙이기

 - 가장 원시적인 방법일 수 있으나 갓셀은 굉장히 이를 잘 인식해준다.

 - 특이한 데이터의 경우 붙일 때 Ctrl+Alt+v 로 붙이고 유니코드 텍스트 등을 선택해야 잘 인식된다.

 - 이 작업을 여러번 반복해야 하는 경우, 간헐적으로 키가 씹혀서 붙이는 Starting Cell에 v만 입력되기도 하므로 주의

 

 

이런 케이스가 아주 많이 일어나진 않는다.

Data Scraping 등이 안 되는지 체크해보고 위를 시도해 보도록 하자.

+ Recent posts