데이터 분석 공부 기록

[Kaggle] 4년간의 뉴욕시 급여 New York City - Citywide Payroll Data

note818 2025. 4. 16. 23:59

Find Open Datasets and Machine Learning Projects | Kaggle

 

New York City - Citywide Payroll Data

Salaries paid to New York City employees over four years

www.kaggle.com

  • "뉴욕시는 누구에게, 얼마나, 왜 급여를 지급했을까?"이번에 분석할 데이터는 2014년부터 2017년까지 4개 회계연도 동안 뉴욕시 전 직원에게 실제 지급된 급여 내역으로, 투명한 행정과 예산 운용을 이해할 수 있는 중요한 정보입니다.
    • 어떤 부서가 가장 많은 인건비를 사용하는가?
    • 어떤 직무가 상대적으로 높은 급여를 받고 있는가?
    • 근속년수가 늘어날수록 실제 보상은 얼마나 증가하는가?
    복잡한 도시 행정 속에서 이루어지는 ‘보상의 구조’를 데이터로 직접 들여다보며, 공공 인력의 급여 분포와 인사 트렌드를 함께 해석해보겠습니다.
  • 데이터에는 각 직원의 소속 부서, 직위, 기본 연봉, 정규 근무 시간, 초과 수당, 기타 보상, 근무 시작일, 근무지 등 인건비 구조를 설명할 수 있는 상세한 항목이 포함되어 있어, 다음과 같은 핵심 질문에 집중해 분석을 진행하고자 합니다:
  • 미국 최대 도시이자 세계적인 메트로폴리스인 뉴욕시(New York City)는 방대한 행정 조직을 통해 시민 생활의 구석구석을 지원하고 있습니다. 이 과정에서 수십만 명에 이르는 공공 인력을 고용하고 있으며, 그들에게 지급되는 급여는 도시 예산에서 큰 비중을 차지합니다.

 

부서별 인건비 총합 분석 및 상위 10개 부서 시각화

import matplotlib.pyplot as plt

# '$'와 ',' 제거하고 숫자로 변환
def clean_money(col):
    return pd.to_numeric(df[col].replace('[\$,]', '', regex=True), errors='coerce')

df['Regular Gross Paid'] = clean_money('Regular Gross Paid')

# 결측값 제거
df_clean = df.dropna(subset=['Agency Name', 'Regular Gross Paid'])

# 부서별 정규급여 총합 계산
agency_salary = df_clean.groupby('Agency Name')['Regular Gross Paid'].sum().sort_values(ascending=False)

# 상위 10개 부서 시각화
top10_agencies = agency_salary.head(10)

plt.figure(figsize=(12, 6))
top10_agencies.plot(kind='bar')
plt.title('Top 10 NYC Agencies by Total Regular Gross Pay (2014–2017)')
plt.ylabel('Total Gross Pay (USD)')
plt.xticks(rotation=45, ha='right')
plt.tight_layout()
plt.grid(axis='y', linestyle='--', alpha=0.7)
plt.show()

 

순위 부서 이름 해석
1 DEPT OF ED PEDAGOGICAL 교육부 소속 교원 인건비. 전체에서 압도적으로 가장 높은 총 급여를 차지하고 있음.
2 POLICE DEPARTMENT 경찰국. OT 수당이 많고, 인력 규모도 크며, 보상 수준도 높은 직군. 안전 유지 인력에 대한 투자 규모 큼.
3 FIRE DEPARTMENT 소방국. 경찰국과 유사하게 고위험 직무군으로 평균 급여와 OT 수당 비중이 높은 편.
4 DEPT OF ED PARA PROFESSIONALS 교육 보조 인력(Teaching Assistants 등). PEDAGOGICAL과는 구분되며, 보조직의 규모가 크다는 것을 의미.
5~10 POLICE DEPARTMENT (중복 포함), DEPT OF CORRECTION, DEPT OF EDUCATION ADMIN, DEPT OF SOCIAL SERVICES, DEPT OF SANITATION 등 경찰 관련 부서 이름이 중복되어 등장하는 것으로 보아, 같은 부서가 표기 방식에 따라 중복 집계된 가능성이 있음. 그 외에도 교정국, 사회복지국, 청소국 등이 상위권에 위치함.

 

평균 급여가 가장 높은 직무는? ( 평균 급여가 가장 높은 직무 TOP 20) 

import pandas as pd

# 데이터 로드
df = pd.read_csv('nyc_salary_data.csv')

# '$'와 ',' 제거 후 숫자로 변환
df['Regular Gross Paid'] = pd.to_numeric(df['Regular Gross Paid'].replace('[\$,]', '', regex=True), errors='coerce')

# 결측값 제거
df_clean = df.dropna(subset=['Title Description', 'Regular Gross Paid'])

# Title별 평균 급여 계산
title_avg_salary = df_clean.groupby('Title Description')['Regular Gross Paid'].mean().sort_values(ascending=False)

# 상위 20개 직무 출력
top_titles = title_avg_salary.head(20)
print(top_titles)
직무명 평균 연봉 (USD)
CAPTAIN DETAILED AS ASSISTANT CHIEF INSPECTOR $207,673
ASSISTANT CHIEF OF DEPARTMENT $200,132
PRESIDENT (기관장) $190,635
WARDEN (교정국 간수 책임자) $178,786
FIRST DEPUTY COMMISSIONER $172,473
DEPUTY MAYOR $163,919
COMMUNITY SUPERTINDENT $160,603
COUNSEL (법률고문) $154,387

 

 

평균 급여 상위 직무는 대부분 행정적 리더십, 공공안전, 교육정책, 법률 자문전문성과 조직 책임이 높은 포지션이 차지

 

 

 

근속년수 vs 평균 급여 분석 코드

근속년수에 따라 보상이 어떻게 변화하는지 알아보도록 하겠습니다 

 

  • 입직 초기 (0~5년)
    • 평균 연봉은 2만~3만 달러 수준으로 시작
    • 짧은 경력 직군, 파트타임, 시급제 직원이 많기 때문에 급여 수준이 낮게 형성됨
    • 특히 0년차는 실급여가 거의 없는 경우도 있어 인턴/단기 계약직 포함 가능성 있음
  • 5년차 이후부터 가파른 상승
    • 5~10년 차 구간에서 급여가 빠르게 상승
    • 10년차에는 평균 연봉이 4만 5천 달러를 넘기며 안정적인 보상구조에 진입
    • 이 시기부터는 정규직 비중이 높아지며, 승진 혹은 직무 숙련도 상승 영향도 반영됨
  • 15~25년차: 보상 최고 구간
    • 해당 구간에서 평균 연봉은 5만 5천~5만 8천 달러 수준
    • 대부분의 직원들이 중간 관리자급 이상으로 진입하는 시기로 판단
    • 급여 정점은 약 20~22년차에 위치함
  • 30년 이상 구간: 하락세
    • 30년 이상 근속자 평균 급여는 다시 5만 달러 미만으로 하락
    • 은퇴를 앞둔 시니어 직원들의 단축 근무, 보직 변경, 또는 연봉 삭감 등이 평균 하락에 기여한 것으로 추정
    • 일부는 업무 전환이나 휴직 등도 포함 가능
  • 시사점
    • 근속 5년 이상부터의 급여 상승 효과는 분명하며, 일정 시점까지는 근속이 확실한 보상 성장을 가져옵니다.
    • 그러나 30년 이상 초장기 근속자의 경우 평균 보상은 오히려 낮아지며, 이는 은퇴 전 조정 등의 정책적 효과가 반영된 결과로 해석할 수 있습니다.
    • 고연차에도 높은 보상을 유지하려면, 일반 행정직보다는 승진형 직무(관리직, 전문직)로의 전환이 필요할 가능성이 큽니다.

근속기간이 늘어날수록 보상이 증가하는 경향은 분명히 존재하지만, 일정 시점 이후에는 정체되거나 감소하는 구간도 존재했다. 단순히 오래 근무하는 것보다, 어떤 직무와 경로로 커리어를 설계하느냐가 보상 구조에 더 중요한 변수

 

 

마무리

이번 분석을 통해 우리는 뉴욕시의 실제 급여 데이터를 기반으로, 도시 행정의 인건비 구조가 어떻게 구성되어 있는지, 그리고 그 안에서 어떤 요소들이 보상의 차이를 만들어내는지 구체적으로 확인할 수 있었습니다.

  • 부서별로는 교육, 경찰, 소방 등 필수 공공서비스 부서가 인건비 지출의 상당 부분을 차지하고 있으며, 이들은 인력 규모뿐 아니라 초과수당 등 다양한 보상 구조를 통해 높은 총 급여를 나타내고 있습니다.
  • 직무별로는 리더십 포지션과 고위 관리직, 전문직 직무가 가장 높은 평균 급여를 기록했으며, 이는 직무의 책임도와 전문성이 보상의 핵심 요인임을 보여줍니다.
  • 근속년수와 급여의 관계는 전형적인 U자형 곡선을 보여주며, 일정 시점까지는 보상이 지속적으로 증가하지만, 30년 이상의 초장기 근속자 구간에서는 오히려 평균 급여가 감소하는 현상이 나타났습니다. 이는 은퇴를 앞둔 조정, 업무 전환 등 제도적 요인이 작용했을 가능성이 높습니다.

결국, 이 데이터는 단순히 '누가 더 오래 일했는가'가 아닌, ‘어떤 직무에서 어떻게 커리어를 쌓아왔는가’가 보상에 더 큰 영향을 미친다는 사실을 말해줍니다.
공공 인력 시스템에서도 보상은 단순 연차 누적이 아닌, 전문성, 직무 특성, 경력 설계에 따라 달라지는 구조적 결과물이라는 점을 이 데이터는 잘 보여주고 있습니다.