Overview
통합 검색
통합 검색
Overview
신청했던 MCF DP-900자격증 시험이 당장 내일이었기 때문에 오늘은 오전 9시 동네 도서관이 오픈할때부터 도서관에 가서 하루를 보냈다.
단순 개념 정리보다는 문제를 많이 보면서 모르는 부분을 그때그때 찾아 정리하는 방식으로 공부했다.
전체적으로 약 150문제 가까운 문제들을 훑어봤고, 한 문제를 푸는 데 오래 걸리더라도 선지 하나하나를 확인하는 데 시간을 썼다.
문제를 풀다 보니 단순히 데이터베이스 이름을 외우는 수준으로는 절대 해결되지 않는 문제들이 많았다.
특히 Notebook, Azure Data Lake, Azure Synapse Analytics 같은 개념들이 문제 속에서 계속 등장했는데,
이름만 알고 있는 상태에서는 선지 판단이 거의 불가능했다.
Notebook은 처음에는 단순한 코드 실행 화면 정도로 생각했는데 실제로는 데이터 분석 과정에서 SQL, Python 같은 코드를 섞어서 실행하고 결과를 바로 확인할 수 있는 작업 공간에 가깝다는 점을 다시 정리했다.
Azure Synapse나 Databricks 같은 환경에서 Notebook이 왜 필요한건지, 단순 쿼리 실행과 어떤 차이가 있는지를 중심으로 이해하려고 했고
실제 웹사이트에 들어가서 이게 뭔가.. 찾아보기도 했다. 완벽히 이해는 아직 하지 못한 상태지만 대충이나마 감을 잡은 것 같다.
Azure Data Lake에 대해서도 다시 찾아봤는데 처음에는 그냥 대용량 데이터 저장소 정도로 생각했지만 문제를 풀다 보니 구조화되지 않은 데이터, 로그 데이터, 분석용 원본 데이터를 장기적으로 저장하는 용도라는 점이 반복해서 등장했다. 관계형 데이터베이스처럼 바로 쿼리해서 쓰는 공간이 아니라, 분석을 위한 raw 데이터를 쌓아두는 공간이라는 점을 기준으로 정리했다.
그리고 문제를 어떻게든 빨리 풀려고 하다보니 용어에 대한 정리도 미흡하긴 했었는데, 마침내 3회독쯤 되었을때서야 ETL과 ELT가 서로 다른 용어라는 걸 발견했다.. 사실 중간에 왜 같은 문제가 있지? 라는 생각이 들었고 답도 다르길래 오류인가 싶었지만 그래도 오늘안에 이걸 발견했다는 게 참 다행인 것 같다..
오늘 문제 풀이에서 가장 힘들었던 부분은 영어 문제였다. 단어 자체가 어려웠다기보다는 문제를 한글로 번역해서 읽을 때 의미가 애매하게 바뀌는 경우가 많았다. 예를 들자면 SQL Server migration 같은 표현이 한국말로 번역했을 때 Server 이사 이런 식으로 되다보니 미묘하게 다르게 해석되면서 선지 판단을 더 어렵게 만들었고 시간도 더 쓸 수 밖에 없던 것 같다.
그래서 한글로만 보지 않고 다시 원문 영어 문장을 기준으로 읽어보는 방식으로 문제를 풀었다.
이 과정을 거치지 않으면 문제 의도가 완전히 다르게 보이는 경우도 있었다.
이후에는 GitHub 관련 작업도 함께 진행했다. 기존에 사용하던 GitHub README Stats가 계속 오류를 내서, 오늘은 아예 직접 배포하는 방식으로 구조를 다시 잡았다. github-readme-stats를 Vercel에 직접 배포하고, 환경변수 설정부터 토큰 관리까지 하나씩 점검했다.
중간에 토큰 관련 에러가 계속 발생했는데, github-readme-stats는 일반적인 GITHUB_TOKEN이 아니라 PAT_1이라는 이름의 환경변수를 요구한다는 점을 확인했다. 이 부분을 모르고 계속 다른 이름으로 설정해서 에러가 났고, 환경변수 이름을 맞춘 뒤 redeploy를 진행하자 정상적으로 동작했다.
정상 동작 이후에는 README에 들어갈 stats 카드와 언어 카드의 테마와 표현 방식도 다시 조정했다. 퍼센트 기반 랭크 표기를 했더니 TOP 70.2%라고 표시가 되길래 이건 더 마음이 아팠다. 차라리 B가 나아보였는데 이 표기가 알고보니 반대로 상위 29.8%라는 의미였다.
그래도 아직은 부족하다고 판단도 들고 숫자를 강조하기보다는 전체 활동 흐름을 보조하는 용도로만 stats를 배치했다.
문제를 많이 풀면서 헷갈리는 개념을 직접 찾아 정리하는 방식이 내가 주로 사용하는 공부 방법이다. 이 방법의 장점은 짧은 시간 안에 많은 범위를 훑을 수 있다는 점이지만, 단점이라면 개념을 처음부터 체계적으로 잡기보다는 문제 해결 중심으로 접근하게 된다는 점인 것 같다.
내일 오전 11시에 시험을 보고 나서, 시험이 끝난 뒤 카페에서 복기하면서 Azure Data 관련 개념들을 다시 한 번 정리해볼 계획이다. 오늘 헷갈렸던 부분들을 기준으로 다시 보는 게 더 효율적일 것 같다.

그리고 깃허브 페이지를 만들면서 stat 카드를 처음 사용해보게 되었는데 커밋 기록이 643회, PR 98회 등 작년에 꽤 열심히 깃허브 활동을 했다고 생각했는데 랭크가 B가 나왔길래 살짝 서운하긴했다. 그래도 상위 퍼센트로 확인해보면 상위 30%에 해당하기도 하고, 깃허브를 시작한지 1년만에 이 정도로 열심히했다면 그걸로도 만족스러운 결과고 앞으로 더 열심히 해야겠다는 목표도 다시 한번 생긴 것 같다.
작년 9월부터 지금까지 이 자격증까지 따게 된다면 5개의 자격증을 따게 되는데 정말 운이 좋게도 한번에 계속 합격을 해서 기운이 좋은 것 같다는 느낌도 든다. 어쨌든 내일 시험을 잘 보고 왔으면 좋겠고 파이팅이다!~!~!
댓글 0