분류 전체보기 14

[Kaggle] 4년간의 뉴욕시 급여 New York City - Citywide Payroll Data

Find Open Datasets and Machine Learning Projects | Kaggle New York City - Citywide Payroll DataSalaries paid to New York City employees over four yearswww.kaggle.com"뉴욕시는 누구에게, 얼마나, 왜 급여를 지급했을까?"이번에 분석할 데이터는 2014년부터 2017년까지 4개 회계연도 동안 뉴욕시 전 직원에게 실제 지급된 급여 내역으로, 투명한 행정과 예산 운용을 이해할 수 있는 중요한 정보입니다.어떤 부서가 가장 많은 인건비를 사용하는가?어떤 직무가 상대적으로 높은 급여를 받고 있는가?근속년수가 늘어날수록 실제 보상은 얼마나 증가하는가?복잡한 도시 행정 속에서 이루어지는 ‘보..

[kaggle] 글로벌 설탕 소비 트렌드 분석 (1960–2023) Global Sugar Consumption Trends (1960–2023)

Global Sugar Consumption Trends (1960–2023) Global Sugar Consumption Trends (1960–2023)ataset Tracking 60+ Years of Sugar Intake, Economic Drivers, and Health Outcomeswww.kaggle.com설탕은 이제 단순한 식재료가 아닙니다. 그것은 생활 수준의 지표이자, 현대 식문화와 건강 문제를 동시에 말해주는 사회적 신호입니다. 전 세계적으로 설탕 소비가 증가하면서, 비만과 당뇨병 같은 만성 질환의 급증도 함께 나타나고 있습니다. 이는 이제 단순한 개인의 문제가 아닌, 공중보건과 국가 정책 차원에서 중요한 이슈로 떠오르고 있죠.그렇다면 설탕은 누가 더 많이 먹고 있을까요? 그리고 ..

Chat GPT vs Gemini 2.5Pro 뭐가 더 좋을까?

AI 시장의 경쟁이 치열해지는 가운데, 구글이 야심차게 선보인 차세대 인공지능 모델 ‘Gemini 2.5 Pro’가 주목을 받고 있습니다. 기존에는 유료 사용자(Advanced 플랜)에게만 제공되던 이 모델이 이제 무료 사용자에게도 제한적으로 개방되면서, 보다 많은 이들이 체험할 수 있게 되었는데요. Gemini 2.5 Pro는 단순한 Q&A를 넘어, 정보를 분석하고, 논리적으로 추론하며, 맥락과 뉘앙스를 고려해 결론을 도출하는 ‘사고형(thinking)’ AI입니다. 구글은 이를 두고 “지금까지 우리가 만든 가장 지능적인 모델”이라고 자신 있게 소개하고 있으며, 이는 AI 기술의 새로운 전환점을 보여주는 상징적인 순간이라 할 수 있습니다. 현재 이 모델은 Google AI Studio와 **Gemini..

신 문물 탐구 2025.04.08

[kaggle] 중국 대기오염, 10년간 어떻게 변했을까? Air Pollution in China (2015-2025)

Find Open Datasets and Machine Learning Projects | Kaggle Air Pollution in China (2015-2025)Synthetic Air Pollution Data from Major Chinese Cities (2015-2025)www.kaggle.com본 포스트에서는 2015년부터 2025년까지 중국의 주요 5개 도시(베이징, 상하이, 광저우, 청두, 선전)를 대상으로 한 합성 대기오염 데이터셋을 활용하여, 대기질 변화 및 주요 오염물질 추세를 분석합니다.해당 데이터는 총 3,000개의 샘플과 24개의 변수로 구성되어 있으며, 각 도시의 기상 정보, 주요 대기오염 지표(PM2.5, PM10, NO2 등), 지역 정보를 포함하고 있습니다.이 데이터는 ..

[kaggle] 유튜브 인기 영상 Top 1000 분석 2025년 1월 기준, 어떤 영상이 사람들을 사로잡았을까? Most popular 1000 Youtube videos

Find Open Datasets and Machine Learning Projects | Kaggle Most popular 1000 Youtube videosPopular Videos as of 27th Jan 2024www.kaggle.com 2025년 1월 27일 기준, 유튜브에서 가장 많은 인기를 끈 1000개의 영상 데이터를 수집했습니다. 조회수, 좋아요 수, 댓글 수, 영상 길이, 업로드 날짜 등 다양한 정보를 바탕으로 분석해보며, 어떤 콘텐츠가 사랑받았는지, 어떤 특징을 가진 영상이 상위권에 올랐는지 살펴보려 합니다. 단순한 순위 나열을 넘어, 인기 영상들의 공통점과 트렌드를 데이터로 확인해보는 시간이 될 거예요. 영상 콘텐츠에 관심 있는 분들이라면 재미있게 보실 수 있을 겁니다. 1. 조..

[공공 데이터 포털] 한국도로교통공단_가해운전자 차종별 월별 교통사고 통계

데이터 상세 | 공공데이터포털- 경찰에서 조사, 처리한 교통사고에 대한 통계 정보로 인적 피해가 있는 사고만 집계 됨- 교통사고분석시스템(http://taas.koroad" data-og-host="www.data.go.kr" data-og-source-url="https://www.data.go.kr/data/15070209/fileData.do#layer_data_infomation" data-og-url="https://www.data.go.kr/data/15070209/fileData.do" data-og-image="https://blog.kakaocdn.net/dna/bZR6xZ/hyYxKRAlKp/AAAAAAAAAAAAAAAAAAAAAKEPveoVtH6bQmJ2Rk39YF8lpRgWJ08V9XmdCAug0dui/img.png?credential=yqXZFxpELC7KVnFOS48ylbz2pIh7yKj8&expires=1756652399&allow_ip=&allow_referer=&signature=A4eHTb%2FFxKT%2BoCyQKYxSKz0YfDw%3D

[공공 데이터 포털] 경찰청 범죄 발생 지역별 통계 2018 ~ 2023 6년 자료

데이터 상세 | 공공데이터포털범죄대분류, 범죄중분류, 서울, 부산, 대구, 인천, 광주, 대전 울산, 세종, 경기도 지" data-og-host="www.data.go.kr" data-og-source-url="https://www.data.go.kr/data/3074462/fileData.do#layer_data_infomation" data-og-url="https://www.data.go.kr/data/3074462/fileData.do" data-og-image="https://blog.kakaocdn.net/dna/bso8j7/hyYvkeUJNt/AAAAAAAAAAAAAAAAAAAAAKquatwXUMXkZ1uszNe3G-gYWJ4EFpqYEutwySDuLQxQ/img.png?credential=yqXZFxpELC7KVnFOS48ylbz2pIh7yKj8&expires=1756652399&allow_ip=&allow_referer=&signature=0jP9%2B4gyUQWz1y8OdYIjAq%2FPYA4%3D

[kaggle] 넷플릭스 영화와 TV 프로그램 데이터분석 Netflix Movies and TV shows till 2025

Find Open Datasets and Machine Learning Projects | Kaggle Netflix Movies and TV shows till 2025A curated dataset of Netflix content sourced from TMDb, including titles, genreswww.kaggle.com  넷플릭스, 요즘 뭐 보고 계신가요? 요즘 저를 웃기고 울린 드라마, 폭싹 속았수다 정말 재미있게 보고 있습니다. 매주 4화씩 나오는 것도 기다림의 묘미였는데, 이번 주 3월 28일에 4막을 마지막으로 끝난다니… 벌써부터 아쉬운 마음이 가득해요.이 드라마처럼 감동도 있고 위로도 주는 콘텐츠가 있어서 넷플릭스를 끊을 수가 없나 봅니다.넷플릭스를 켜면 수많은 영화와 드라마들..

[kaggle] Tesla Stock Price Data 테슬라 주가 데이터 (2000-2025)

Tesla Stock Price Data (2000-2025) Tesla Stock Price Data (2000-2025)Historical daily stock prices of Tesla from 2000 to 2025www.kaggle.com 이번 포스팅에서는 테슬라(Tesla Inc.)의 2000년 1월부터 2025년 3월까지의 주가 데이터를 분석해보려고 합니다.데이터에는 매일의 시가(Open), 고가(High), 저가(Low), 종가(Close), 거래량(Volume) 등의 정보가 담겨 있어, 시계열 분석이나 주가 패턴 탐색, 간단한 머신러닝 실험까지도 해볼 수 있을거같습니다 .   1. 테슬라 데이터 시각화import matplotlib.pyplot as plt# 시계열 그래프: 전체 기간 ..

동행복권 로또번호 예측하기

부자가 되겠다 !  로또 번호를 분석해 예측한다는 말 자체가 어쩌면 어리석은 일일지도 모릅니다.솔직히 저도 압니다. 로또라는 건 완전한 우연이고, 운명과도 같은 확률의 영역이라, 논리적으로 분석하거나 예측할 수 없다는 걸 말입니다.하지만 가끔 사람은 불가능한 일에도 작은 희망을 걸곤 합니다. 확률과 이성을 잠시 내려놓고, '혹시…?' 하는 아주 작은 가능성에 기대어 보는 거죠.이 글 역시 그런 감성에서 출발합니다.여기서 철저히 논리는 배제할 것입니다. 대신, 아주 작은 가능성과 호기심만을 따라가는 여정이 될 것입니다. 말도 안 되는 일을 시도한다는 걸 알지만, 그럼에도 불구하고 설레는 마음으로 시작해 보겠습니다.  1.동행복권 데이터 가져오기 2. 1회부터 1164회까지 데이터 가져오기 import pa..