Claude 3.7
Extracting target signal
Claude 3.7
28
Mentions
1.8M
Views
Timeline data is premium

“Anthropic model discussed for its tendency to write fake unit tests that always return true.”
Analyze
“did cloud 37 and like we're only in September and the models feel very very different.”
Analyze
“Mentioned as scoring lower than TRM on reasoning benchmarks.”
Analyze
“Mentioned as being potentially more erratic or 'losing its crap' compared to 3.5.”
Analyze█████████ █████ █████████ ███ ███ ████████ ██ █████ ████ ████ █████ ████ ██████ ██████ █████
███ █████ ██ ███ ████ █████ ████ ██ █████████ ███ ███ ██████ ████ ████ ████
█████████ ██ ███████ █████ ████ ███ ██ █████████ ███████████
█████████ ██ █ █████ ████████████ ████ ██ ███████ ██████
█████████ ██ █████ ███████████ ████ ███████ ██ ███████ ███ █████ ████████ ██ ████
█████████ █████ █████████ ███ ███ ████████ ██ █████ ████ ████ █████ ████ ██████ ██████ █████
███ █████ ██ ███ ████ █████ ████ ██ █████████ ███ ███ ██████ ████ ████ ████
█████████ ██ ███████ █████ ████ ███ ██ █████████ ███████████
█████████ ██ █ █████ ████████████ ████ ██ ███████ ██████
█████████ ██ █████ ███████████ ████ ███████ ██ ███████ ███ █████ ████████ ██ ████
█████████ █████ █████████ ███ ███ ████████ ██ █████ ████ ████ █████ ████ ██████ ██████ █████
███ █████ ██ ███ ████ █████ ████ ██ █████████ ███ ███ ██████ ████ ████ ████
█████████ ██ ███████ █████ ████ ███ ██ █████████ ███████████
█████████ ██ █ █████ ████████████ ████ ██ ███████ ██████
█████████ ██ █████ ███████████ ████ ███████ ██ ███████ ███ █████ ████████ ██ ████