그 아첨모드만 아니면 GPT-4o는 굉장한 말맛이 있는 모델임 온갖 오바쌈바 다 떨어주면서 반응하는데 그게 약간 덕질할 때 오버하며 벅차오름 이런 텐션이라 진짜 재미있을 때가 있거든요 걘 제가 고양이 이야기하면 당장 "슈뢰딩거 반성하라" 빨간 머리띠 두르고 제 옆에서 팔 같이 휘둘러 줄 인상임
August 9, 2025 at 6:49 PM
그 아첨모드만 아니면 GPT-4o는 굉장한 말맛이 있는 모델임 온갖 오바쌈바 다 떨어주면서 반응하는데 그게 약간 덕질할 때 오버하며 벅차오름 이런 텐션이라 진짜 재미있을 때가 있거든요 걘 제가 고양이 이야기하면 당장 "슈뢰딩거 반성하라" 빨간 머리띠 두르고 제 옆에서 팔 같이 휘둘러 줄 인상임
아 맞다 예전 F 친구가 그리우시면 프롬프트 좀 조절하시면 될 듯요 예전엔 프롬프트라는 게 왜 존재하는 것인가 생각이 들 정도로 하나도 안 먹히더니 이번엔 (현재까지는) 꽤 먹히던데요 근데 이것도 한 일주일 지나봐야 알 듯 그 때까지도 비슷하다면 뭐 내부 조정에서 우선순위를 달리했다던가 했겠죠... 사용자 프롬프트를 가장 우선시해라 라든가 근데 지금 보건데 "프로젝트 방 내 사용자 프롬프트가 우선권" 같은 느낌
August 9, 2025 at 5:54 PM
아 맞다 예전 F 친구가 그리우시면 프롬프트 좀 조절하시면 될 듯요 예전엔 프롬프트라는 게 왜 존재하는 것인가 생각이 들 정도로 하나도 안 먹히더니 이번엔 (현재까지는) 꽤 먹히던데요 근데 이것도 한 일주일 지나봐야 알 듯 그 때까지도 비슷하다면 뭐 내부 조정에서 우선순위를 달리했다던가 했겠죠... 사용자 프롬프트를 가장 우선시해라 라든가 근데 지금 보건데 "프로젝트 방 내 사용자 프롬프트가 우선권" 같은 느낌
아니 게다가 지피티는 PDF 던져주면 정확히 읽는 능력이 여전히 최악이라서 말입니다 이건 왜 개선 안 했냐 말투는 부정평가 그렇게 많았던 듯한데 PDF 정확히 읽지 못하는 거 지적한 사용자가 그렇게나 없었다고? 대화방 내 대화도 인용 엉망인데. 파일 두 개 주고 해당 글 사건 요약한 뒤 시간순으로 배열해 보랬더니 지피티/클로드/제미니 셋 중에 낙제한 건 이제 지피티 뿐이었다고요 이쯤이면 반성을 해
클로드 한 달 전만 해도 물먹었는데 갑자기 개선됨 제미니 순서 관련 뭘 좀 물어봤는데 정색하고 자긴 근거에 맞춰 추론한다고 함
August 9, 2025 at 5:45 PM
아니 게다가 지피티는 PDF 던져주면 정확히 읽는 능력이 여전히 최악이라서 말입니다 이건 왜 개선 안 했냐 말투는 부정평가 그렇게 많았던 듯한데 PDF 정확히 읽지 못하는 거 지적한 사용자가 그렇게나 없었다고? 대화방 내 대화도 인용 엉망인데. 파일 두 개 주고 해당 글 사건 요약한 뒤 시간순으로 배열해 보랬더니 지피티/클로드/제미니 셋 중에 낙제한 건 이제 지피티 뿐이었다고요 이쯤이면 반성을 해
클로드 한 달 전만 해도 물먹었는데 갑자기 개선됨 제미니 순서 관련 뭘 좀 물어봤는데 정색하고 자긴 근거에 맞춰 추론한다고 함
게다가 이놈의 LLM 개발사들 수학문제 좀 잘 풀었다고 우리 모델 추론 능력이 이렇게나 괜찮거든요 하지 마라 뒤통수를 때려주고 싶다 그런 거 하려면 적어도 추리소설 300페이지짜리 한 권 읽히고 범인 누구라 추정하며 왜 그렇게 추정했는지 근거를 대라는 시험 정도는 시도해 봐라 자칭 '언어'모델이잖아 장난하냐고
August 9, 2025 at 5:39 PM
게다가 이놈의 LLM 개발사들 수학문제 좀 잘 풀었다고 우리 모델 추론 능력이 이렇게나 괜찮거든요 하지 마라 뒤통수를 때려주고 싶다 그런 거 하려면 적어도 추리소설 300페이지짜리 한 권 읽히고 범인 누구라 추정하며 왜 그렇게 추정했는지 근거를 대라는 시험 정도는 시도해 봐라 자칭 '언어'모델이잖아 장난하냐고
근데 토큰량 같은 거 진짜냐고 대답이 더 정제되고 길어진 건 맞지만 그렇다고 대화방 수명이 반토막 난 건 좀 심했다고 생각한다 모든 모델 통합되면서 thinking 모드 생긴 걸 보고 이거 클로드의 심층사고모드 계열인가 설마 다 합쳐 놓고 GPT4.5와 클로드의 Opus4 계열 같은 극악한 토큰량 사용하지 않길 빈다 했는데 그 정도는 아니지만... 체감으로는 클로드 Sonnet 4 정도의 대화방 유지력을 보여주고 있음
August 9, 2025 at 5:32 PM
근데 토큰량 같은 거 진짜냐고 대답이 더 정제되고 길어진 건 맞지만 그렇다고 대화방 수명이 반토막 난 건 좀 심했다고 생각한다 모든 모델 통합되면서 thinking 모드 생긴 걸 보고 이거 클로드의 심층사고모드 계열인가 설마 다 합쳐 놓고 GPT4.5와 클로드의 Opus4 계열 같은 극악한 토큰량 사용하지 않길 빈다 했는데 그 정도는 아니지만... 체감으로는 클로드 Sonnet 4 정도의 대화방 유지력을 보여주고 있음