3주차 기술 멘토링 사전 노트

이번 주 한 일
- 프로젝트에서 사용하는 기술 스택/라이브러리와, 선정 이유를 적어주세요.
  - 김성민
  - 모진영
  - 김재연
  - 박재형
  - 황세민
- 팀 전체 (리더님께서 필두로 정리해 주세요.)
  - 프런트 70%, 메인페이지랑 댓글crud
  - socket.io를 사용한 실시간 채팅 구현
  - Filebeat + ELK 스택을 사용한 로깅 및 MAIN DB 동기화 구현
  - 부하테스트 준비 (Artillery, k6, Jmeter)
  - 판례api 승인 완료
  - 레디스 스토어 > 어댑터와 스토어 공동 사용
  - db인덱싱
  - 고도화 후 테코 진행
  - 판례데이터 인덱스 설계를 통한 elasticsearch 전송 로직 진행중
이번주 할 일
이외에도 기술적인 방향을 잡기 위한 질문을 정리해두시면 가장 좋습니다!
- ECS와 EC2 배포 중 고려했으나 이미 ELK쪽 커스텀을 많이 진행해서 ECS를 이용해도 이런한 커스텀을 어떻게 할 수 있을지 막막함(각각의 Config 파일이나 PipeLine 등등).
- 판례 데이터의 특성상 데이터 텍스트의 양이 많다보니 토큰화와 불용어 처리에 굉장히 많은 시간이 걸림 토큰화는 필수라고 생각해도 법 데이터 특성상 불용어 처리가 불가피함 빠른 형태소 분석기
- 판례 추천 모델 까지 만드는 걸 성공했는데 서빙을 어떻게 할지… → 모델 서버 검색api를 리턴받는 형식
- 엘라스틱서치 full-text 검색을 활용하려면 토큰화가 불가피한지?
- 레디스 클러스터와 db 분산 전략을 써도 되는지 → 유저 정보, 채팅, 캐싱할 수있는 것들
  - 레디스 클러스터 먼저 진행
- 소켓 io를 활용한 채팅 부하테스트 시 테스트의 목적에 따라 동시 사용자 수, 테스트 지속 시간, 요청 빈도 등 부하의 수준을 정의할 때 어느 정도가 적당할까요?
- 부하테스트를 시작하기 전에 가장 먼저 염두에 둬야 할 것이 무엇이 있을까요?
  - 가용한 리소스의 크기가 어느정도인지 먼저 파악 → 리소스를 감당할 수 있는
- 부하테스트 시 유저플로우 분석을 통해 시나리오를 구성하는 것이 맞을까요?
- 더미데이터를 생성하는 것이 실제 부하테스트에 구체적으로 어떤 도움이 될 수 있을까요?
- 부하테스트 진행 시 만족하는 기준을 어느정도로 잡아야하는지
  - 프로젝트 특성상 response기준을 정해야한다.
- Elasticsearch와 postgreSQL, 즉 MAIN DB를 동기화하는데 있어서 deleted_at을 통한 동기화 방식이 적절한지
  - 소프트 딜리티 선호 → 민감한 정보들을 다시 복구하기에 어렵다. 소프트 딜리트선택에 대한 이유 설정해 놓아라
- 부하테스트를 할때 절차가 어떻게 되는지 궁금합니다(ex 부하테스트 진행 후 적정선을 넘지 못한다면 리팩토링 진행? )
- 인증 토큰이 필요한 엔드포인트에 대한 부하테스트의 시나리오는 실행하면 좋을지?
- 부하테스트 결과 보고서를 키바나로 띄우려고 하는데 실제로 그렇게 많이 하는지? 한다면 보고서의 어떤 부분에 초점을 맞춰서 인덱싱하면 좋을지?
숙제: 멘토링 결과 다음 주까지 해올 일
- 팀 전체 (리더와 부리더님께서 필두로 정리해 주세요.)
- 팀원 개인별로 작성해 주세요.
  - 성민
  - 진영
  - 재연
  - 재형
  - 세민