쌓고 쌓다

[프로그래머스] 뉴스 클러스터링 C++ 풀이 본문

알고리즘/프로그래머스

[프로그래머스] 뉴스 클러스터링 C++ 풀이

승민아 2022. 7. 28. 23:10

https://school.programmers.co.kr/learn/courses/30/lessons/17677?language=cpp# 

 

프로그래머스

코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요.

programmers.co.kr

전체 코드

#include <string>
#include <vector>
#include <iostream>
using namespace std;

int solution(string str1, string str2) {
    int answer = 0;
    vector<string> v1,v2;
    
    for(int i=1;i<str1.length();i++)
    {
        string str;
        str+=str1[i-1];
        str+=str1[i];
        v1.push_back(str);
        for(int j=0;j<2;j++)
        {
            if(str[j]>='A'&&str[j]<='Z')
                continue;
            else if(str[j]>='a'&&str[j]<='z')
                v1[v1.size()-1][j]='A'+(str[j]-'a');
            else
            {
                v1.erase(v1.end());
                break;
            }
        }
    }
    
    for(int i=1;i<str2.length();i++)
    {
        string str;
        str+=str2[i-1];
        str+=str2[i];
        v2.push_back(str);
        for(int j=0;j<2;j++)
        {
            if(str[j]>='A'&&str[j]<='Z')
                continue;
            else if(str[j]>='a'&&str[j]<='z')
                v2[v2.size()-1][j]='A'+(str[j]-'a');
            else
            {
                v2.erase(v2.end());
                break;
            }
        }
    }
    
    int cnt=0;
    for(int i=0;i<v1.size();i++)
    {
        
        for(int j=0;j<v2.size();j++)
        {
            if(v1[i]==v2[j])
            {
                v1.erase(v1.begin()+i);
                v2.erase(v2.begin()+j);
                cnt++;
                i--;
                break;
            }
        }
    }
    if(v1.size()==0&&v2.size()==0)
        answer=65536;
    else
        answer=((double)cnt/(v1.size()+v2.size()+cnt))*65536;
    
    
    return answer;
}

 

대소문자의 차이는 무시하기에 소문자를 모두 대문자로 바꾸어 풀었다.

 

vector<string> v1,v2;

v1과 v2는 두 글자씩 분리한 조건에 맞는 문자열을 넣을 것이다.

 

for(int i=1;i<str1.length();i++)
    {
        string str;
        str+=str1[i-1];
        str+=str1[i];
        v1.push_back(str);
        for(int j=0;j<2;j++)
        {
            if(str[j]>='A'&&str[j]<='Z')
                continue;
            else if(str[j]>='a'&&str[j]<='z')
                v1[v1.size()-1][j]='A'+(str[j]-'a');
            else
            {
                v1.erase(v1.end());
                break;
            }
        }
    }

str1의 문자열을 일단 str에 2 글자씩 넣고 먼저 v1에 넣는다.

str을 탐색한다.

대문자는 그대로 놔두고, 소문자가 있다면 대문자로 변환해주고, 그 외에는 존재하면 안 되는 문자가 있으니 v1에서 제거.

 

int cnt=0;
    for(int i=0;i<v1.size();i++)
    {
        
        for(int j=0;j<v2.size();j++)
        {
            if(v1[i]==v2[j])
            {
                v1.erase(v1.begin()+i);
                v2.erase(v2.begin()+j);
                cnt++;
                i--;
                break;
            }
        }
    }

이제 교집합의 개수를 센다.

같은 단어를 찾으면 v1, v2에서 제거하고 카운트해준다.

 

if(v1.size()==0&&v2.size()==0)
	answer=65536;
else
	answer=((double)cnt/(v1.size()+v2.size()+cnt))*65536;

v1과 v2가 0이라면 모두 공집합인 경우이므로 answer은 65536이 된다.

그게 아니라면

교집합을 합집합으로 나눈 값에 65536을 곱한다.

위에서 교집합은 모두 제거하여 카운트 했으므로 v1과 v2에 남은 것은 겹치지 않는 집합이다.

즉, 합집합 = 교집합 + 겹치지 않는 집합 이기 때문에 위와 같은 식을 세웠다.

 

Comments