이외에도 기술적인 방향을 잡기 위한 질문을 정리해두시면 가장 좋습니다!
- ECS와 EC2 배포 중 고려했으나 이미 ELK쪽 커스텀을 많이 진행해서 ECS를 이용해도 이런한 커스텀을 어떻게 할 수 있을지 막막함(각각의 Config 파일이나 PipeLine 등등).
- 판례 데이터의 특성상 데이터 텍스트의 양이 많다보니 토큰화와 불용어 처리에 굉장히 많은 시간이 걸림 토큰화는 필수라고 생각해도 법 데이터 특성상 불용어 처리가 불가피함 빠른 형태소 분석기
- 판례 추천 모델 까지 만드는 걸 성공했는데 서빙을 어떻게 할지… → 모델 서버 검색api를 리턴받는 형식
- 엘라스틱서치 full-text 검색을 활용하려면 토큰화가 불가피한지?
- 레디스 클러스터와 db 분산 전략을 써도 되는지 → 유저 정보, 채팅, 캐싱할 수있는 것들
- 소켓 io를 활용한 채팅 부하테스트 시 테스트의 목적에 따라 동시 사용자 수, 테스트 지속 시간, 요청 빈도 등 부하의 수준을 정의할 때 어느 정도가 적당할까요?
- 부하테스트를 시작하기 전에 가장 먼저 염두에 둬야 할 것이 무엇이 있을까요?
- 가용한 리소스의 크기가 어느정도인지 먼저 파악 → 리소스를 감당할 수 있는
- 부하테스트 시 유저플로우 분석을 통해 시나리오를 구성하는 것이 맞을까요?
- 더미데이터를 생성하는 것이 실제 부하테스트에 구체적으로 어떤 도움이 될 수 있을까요?
- 부하테스트 진행 시 만족하는 기준을 어느정도로 잡아야하는지
- 프로젝트 특성상 response기준을 정해야한다.
- Elasticsearch와 postgreSQL, 즉 MAIN DB를 동기화하는데 있어서 deleted_at을 통한 동기화 방식이 적절한지
- 소프트 딜리티 선호 → 민감한 정보들을 다시 복구하기에 어렵다. 소프트 딜리트선택에 대한 이유 설정해 놓아라
- 부하테스트를 할때 절차가 어떻게 되는지 궁금합니다(ex 부하테스트 진행 후 적정선을 넘지 못한다면 리팩토링 진행? )
- 인증 토큰이 필요한 엔드포인트에 대한 부하테스트의 시나리오는 실행하면 좋을지?
- 부하테스트 결과 보고서를 키바나로 띄우려고 하는데 실제로 그렇게 많이 하는지? 한다면 보고서의 어떤 부분에 초점을 맞춰서 인덱싱하면 좋을지?