[TIL] 1013 First day of work
Today I Learnt
1012:
First day of work
9:00 - 9:12. Meeting with the lead developer
10:40 - 11:10 Meeting with research Team
11: 20 - 12:00 Meeting with CEO
일단 기본적인 회사 소개와 , business model에 관한 이해를하는시간을가졌다.
resreach team과 회의로 현재 무엇을 하고있으면 무엇을 개발팀에서 만들어야하는지 생각해볼수있는 시간이되었다.
1013:
업무에서 사용할 스킬셋들을 공부해서 개인프로젝트에 적용해보려고했지만, 현재 개인프로젝트는 없어서 (팀프로젝트) 로 그냥 배운것들만 적용하는 토이프로젝트를 만들기로했다.
2주동안 해야할 task를 받았다.
1. 크롤링
2. Naver API
1. 크롤링
-XML :
eXtensible Markup Language
-RSS :
Really Simple Syndication
XML 범용적인 데이터형식, 다른 종류의 시스템간의 빠르고 쉬운 공유
RSS도 XML 형식으로, 뉴스 ,블로그포스트 등이 rss 를 통해 여러 사이트들을 직접방문하지않고 업데이트된것을을 보기쉽게 한눈에 파악할수있다.
https://steemit.com/kr/@andydream/rss-rss
https://devel-up-tree.tistory.com/14
parsing ?:
parsing 여기저기서 본단어인데 뭘하는건지 제대로 뜻을 모르는것같다.
정확히는 어떤 data를 원하는 form으로 만들어 내는 것
현재 task를 하면서 여기다가 앞으로 더 찾아봐야할것들을 여기다 정리를해놔야겟다.
크롤링 을 할때
1. rss 를이용해서 하거나 or 2. 그냥 그웹사이트 를 크롤링해서 가져올수있는 옵션이있는것같다
1. rss를 이용하면 ?
- 해당 rss리스트들을 가지고있어야하는건가?
2. 웹사이트 크롤링?
- 해당사이트마다 html 구조가 다르면 어떻게하나 ?
3. web crawler들은 보통 파이썬이 더많은데 왜그럴까? 더빠른가?
4. selenium 은쓸만한가?
5. Node js 제일 많이쓰는 crawler library가뭘까?
'IT > TIL(Today I Learnt)' 카테고리의 다른 글
[TIL] 1015 똥멍청인가? (6) | 2021.10.16 |
---|---|
[TIL] 1014 Life of software engineer (2) | 2021.10.14 |
[TIL] 1011 Opendoor E-Learning (0) | 2021.10.11 |
[TIL] 1010 Technology Trend (1) | 2021.10.11 |
[TIL] 1009 취업! (8) | 2021.10.09 |