시간당 몇 번 다음과 같은 오류 메시지가 나타납니다.
08.03.18 21:27 kernel CPU0: Core temperature above threshold, cpu clock throttled (total events = 2234)
08.03.18 21:27 kernel CPU2: Core temperature above threshold, cpu clock throttled (total events = 2234)
08.03.18 21:27 kernel CPU1: Package temperature above threshold, cpu clock throttled (total events = 2695)
08.03.18 21:27 kernel CPU3: Package temperature above threshold, cpu clock throttled (total events = 2695)
08.03.18 21:27 kernel CPU2: Package temperature above threshold, cpu clock throttled (total events = 2695)
08.03.18 21:27 kernel CPU0: Package temperature above threshold, cpu clock throttled (total events = 2695)
08.03.18 21:27 kernel CPU2: Core temperature/speed normal
08.03.18 21:27 kernel CPU0: Core temperature/speed normal
08.03.18 21:27 kernel CPU3: Package temperature/speed normal
08.03.18 21:27 kernel CPU1: Package temperature/speed normal
08.03.18 21:27 kernel CPU0: Package temperature/speed normal
08.03.18 21:27 kernel CPU2: Package temperature/speed normal
하드웨어 사양 :
ThinkPad X1 Yoga 2nd
N1NET33W (1.20 )
Intel(R) Core(TM) i7-7600U CPU @ 2.80GHz
Production date 2017.11
소프트웨어:
Distributor ID: Ubuntu
Description: Ubuntu 17.10
Release: 17.10
Codename: artful
Linux 4.13.0-36-generic #40-Ubuntu SMP Fri Feb 16 20:07:48 UTC 2018 x86_64 x86_64 x86_64 GNU/Linux
바이오스 :
BIOS 설정에서 배터리 와 AC 를 모두 성능 으로 설정했는데 BIOS가 최신입니다.
문제가 무엇입니까
문제는 CPU 온도 임계 값이 너무 일찍 도달 하여 CPU가 최대 100 ° C에 도달 하더라도 75 ° C에서 발생한다는 것 입니다. 온도는 절대 85 ° C를 넘지 않습니다. 따라서 CPU 전원이 너무 빨리 조절됩니다.
부적절한 열 페이스트와 관련하여 제조업체 하드웨어 문제가 있는지 또는 소프트웨어와 관련이 있는지 잘 모르겠습니다. Lenovo에 보내기 전에 자체 문제 가 아닌지 확인하고 싶습니다 .
통계
스트레스 테스트를 할 때
stress -c 4 -t 300
오류 메시지는 거의 즉시 발생합니다.
i7z는 다음과 같은 출력을 제공합니다.
Cpu speed from cpuinfo 2903.00Mhz
cpuinfo might be wrong if cpufreq is enabled. To guess correctly try estimating via tsc
Linux's inbuilt cpu_khz code emulated now
True Frequency (without accounting Turbo) 2903 MHz
CPU Multiplier 29x || Bus clock frequency (BCLK) 100.10 MHz
Socket [0] - [physical cores=2, logical cores=4, max online cores ever=2]
TURBO ENABLED on 2 Cores, Hyper Threading ON
Max Frequency without considering Turbo 3003.10 MHz (100.10 x [30])
Max TURBO Multiplier (if Enabled) with 1/2/3/4 Cores is 39x/39x/39x/39x
Real Current Frequency 3187.97 MHz [100.10 x 31.85] (Max of below)
Core [core-id] :Actual Freq (Mult.) C0% Halt(C1)% C3 % C6 % Temp VCore
Core 1 [0]: 3187.97 (31.85x) 99.9 0 0 0 85 1.0037
Core 2 [1]: 3187.97 (31.85x) 99.9 0 0 0 84 1.0037
C0 = Processor running without halting
C1 = Processor running with halts (States >C0 are power saver modes with cores idling)
C3 = Cores running with PLL turned off and core cache turned off
C6, C7 = Everything in C3 + core state saved to last level cache, C7 is deeper than C6
Above values in table are in percentage over the last 1 sec
[core-id] refers to core-id number in /proc/cpuinfo
'Garbage Values' message printed when garbage values are read
Ctrl+C to exit
앞서 언급했듯이 85 Temp를 초과하지는 않지만 CPU는 조절됩니다.
센서 는 다음과 같은 출력을 보여줍니다
iwlwifi-virtual-0
Adapter: Virtual device
temp1: +30.0°C
pch_skylake-virtual-0
Adapter: Virtual device
temp1: +52.0°C
acpitz-virtual-0
Adapter: Virtual device
temp1: +56.0°C (crit = +98.0°C)
thinkpad-isa-0000
Adapter: ISA adapter
fan1: 5859 RPM
coretemp-isa-0000
Adapter: ISA adapter
Package id 0: +59.0°C (high = +100.0°C, crit = +100.0°C)
Core 0: +59.0°C (high = +100.0°C, crit = +100.0°C)
Core 1: +58.0°C (high = +100.0°C, crit = +100.0°C)
그러나 높은 설정은 효과가 없을 것입니다.
보온
그래서 나는 열선을 가지고 놀았습니다.
이것은 내가 찾은 조정 된 구성입니다 .
<?xml version="1.0" encoding="UTF-8"?>
<ThermalConfiguration>
<Platform>
<Name>Use Fan control first then CPU throttle</Name>
<ProductName>*</ProductName>
<Preference>QUIET</Preference>
<ThermalZones>
<ThermalZone>
<Type>x86_pkg_temp</Type>
<TripPoints>
<TripPoint>
<SensorType>x86_pkg_temp</SensorType>
<Temperature>90000</Temperature>
<type>passive</type>
<ControlType>SEQUENTIAL</ControlType>
<CoolingDevice>
<type>_fan_</type>
</CoolingDevice>
</TripPoint>
</TripPoints>
</ThermalZone>
</ThermalZones>
<CoolingDevices>
<CoolingDevice>
<Type>_fan_</Type>
<Path>/sys/bus/platform/devices/thinkpad_hwmon/pwm1</Path>
<MinState>100</MinState>
<MaxState>255</MaxState>
<IncDecStep>50</IncDecStep>
<DebouncePeriod>10</DebouncePeriod>
</CoolingDevice>
</CoolingDevices>
</Platform>
</ThermalConfiguration>
이것은 실질적인 차이는 없지만 최소한 임계 값 설정을 볼 수 있습니다 (마지막 줄).
╰─ sudo thermald --no-daemon --loglevel=info
NO RAPL sysfs present
22 CPUID levels; family:model:stepping 0x6:8e:9 (6:142:9)
Running on a vanilla kernel
Polling mode is enabled: 4
sensor_update: type x86_pkg_temp
sensor_update: type pch_skylake
sensor_update: type iwlwifi
sensor_update: type acpitz
thd_read_default_thermal_sensors loaded 4 sensors
dts /sys/devices/platform/coretemp.0/name doesn't exist
dts /sys/class/hwmon/hwmon3/name doesn't exist
failed to open /dev/acpi_thermal_rel
failed to open /dev/acpi_thermal_rel
TRT/ART read failed
Dumping parsed XML Data
*** Index 0 ***
Name: UseFancontrolfirstthenCPUthrottle
UUID:
type: 0
Zone 0
Name: x86_pkg_temp
Trip Point 0
temp 90000
trip type 2
hyst id 0
sensor type x86_pkg_temp
cdev index 0
type _fan_
influence 0
SamplingPeriod 0
Cooling Dev 0
Type: _fan_
Path: /sys/bus/platform/devices/thinkpad_hwmon/pwm1
Min: 100
Max: 255
Step: 50
AutoDownControl: 0
Product Name matched [wildcard]
sensor index:3 x86_pkg_temp /sys/class/thermal/thermal_zone3/ Async:1
sensor index:1 pch_skylake /sys/class/thermal/thermal_zone1/ Async:0
sensor index:2 iwlwifi /sys/class/thermal/thermal_zone2/ Async:0
sensor index:0 acpitz /sys/class/thermal/thermal_zone0/ Async:0
sensor index:4 hwmon /sys/class/hwmon/hwmon1/temp1_input Async:0
sensor index:5 hwmon /sys/class/hwmon/hwmon1/temp2_input Async:0
sensor index:6 hwmon /sys/class/hwmon/hwmon1/temp3_input Async:0
thd_read_default_cooling devices loaded 4 cdevs
powercap RAPL no long term time window
Use Default pstate drv settings
Product Name matched [wildcard]
3: Processor, C:0 MN: 0 MX:10 ST:1 pt:/sys/class/thermal/ rd_bk 0
1: Processor, C:0 MN: 0 MX:10 ST:1 pt:/sys/class/thermal/ rd_bk 0
2: Processor, C:0 MN: 0 MX:10 ST:1 pt:/sys/class/thermal/ rd_bk 0
0: Processor, C:0 MN: 0 MX:10 ST:1 pt:/sys/class/thermal/ rd_bk 0
4: intel_pstate, C:0 MN: 0 MX:10 ST:1 pt:/sys/devices/system/cpu/intel_pstate/ rd_bk 1
5: _fan_, C:255 MN: 100 MX:255 ST:50 pt:/sys/bus/platform/devices/thinkpad_hwmon/pwm1 rd_bk 1
6: LCD, C:0 MN: 0 MX:1060 ST:106 pt:/sys/class/backlight/intel_backlight/ rd_bk 1
Sorted trip dump zone index:1 type:pch_skylake:
index 0: type:critical temp:115000 hyst:1 zone id:1 sensor id:1 cdev size:0
trip type: 0 temp: 115000
Sorted trip dump zone index:0 type:acpitz:
index 0: type:critical temp:98000 hyst:1 zone id:0 sensor id:0 cdev size:0
trip type: 0 temp: 98000
thd_read_default_thermal_zones loaded 2 zones
zone cpu will be created
dts zone /sys/devices/platform/coretemp.0/name doesn't exist
/sys/class/hwmon/hwmon4/name->iwlwifi
/sys/class/hwmon/hwmon2/name->pch_skylake
/sys/class/hwmon/hwmon0/name->acpitz
dts zone /sys/class/hwmon/hwmon3/name doesn't exist
/sys/class/hwmon/hwmon1/name->coretemp
Buggy max temp: to close to critical 90000
Core temp DTS :critical 100000, max 90000, psv 95000
node type: Element, name: CoolingDevice value: rapl_controller
node type: Element, name: CoolingDevice value: intel_pstate
node type: Element, name: CoolingDevice value: intel_powerclamp
node type: Element, name: CoolingDevice value: cpufreq
node type: Element, name: CoolingDevice value: Processor
CDEVS order specified in thermal-cpu-cdev-order.xml
Sorted trip dump zone index:4 type:cpu:
index 0: type:passive temp:95000 hyst:0 zone id:4 sensor id:65535 cdev size:2
cdev[0] intel_pstate
cdev[1] Processor
trip type: 2 temp: 95000
Product Name matched [wildcard]
zone x86_pkg_temp bounded
Sorted trip dump zone index:5 type:x86_pkg_temp:
index 0: type:passive temp:90000 hyst:0 zone id:5 sensor id:3 cdev size:1
cdev[0] _fan_
trip type: 2 temp: 90000
Zone 1: pch_skylake, Active:0 Bind:0 Sensor_cnt:1
..sensors..
sensor index:1 pch_skylake /sys/class/thermal/thermal_zone1/ Async:0
..trips..
index 0: type:critical temp:115000 hyst:1 zone id:1 sensor id:1 cdev size:0
Zone 0: acpitz, Active:0 Bind:0 Sensor_cnt:1
..sensors..
sensor index:0 acpitz /sys/class/thermal/thermal_zone0/ Async:0
..trips..
index 0: type:critical temp:98000 hyst:1 zone id:0 sensor id:0 cdev size:0
Zone 4: cpu, Active:1 Bind:0 Sensor_cnt:1
..sensors..
sensor index:3 x86_pkg_temp /sys/class/thermal/thermal_zone3/ Async:1
..trips..
index 0: type:passive temp:95000 hyst:0 zone id:4 sensor id:65535 cdev size:2
cdev[0] intel_pstate
cdev[1] Processor
index 1: type:polling temp:90000 hyst:0 zone id:4 sensor id:3 cdev size:0
Zone 5: x86_pkg_temp, Active:1 Bind:1 Sensor_cnt:1
..sensors..
sensor index:3 x86_pkg_temp /sys/class/thermal/thermal_zone3/ Async:1
..trips..
index 0: type:passive temp:90000 hyst:0 zone id:5 sensor id:3 cdev size:1
cdev[0] _fan_
index 1: type:polling temp:85000 hyst:0 zone id:5 sensor id:3 cdev size:0
FD = 7
Current user preference is 0
thd_engine_thread begin
Set : threshold:90000, temperature:53000, cdev:5(_fan_), curr_state:205, max_state:255
Set : threshold:90000, temperature:57000, cdev:5(_fan_), curr_state:155, max_state:255
Set : threshold:90000, temperature:85000, cdev:5(_fan_), curr_state:105, max_state:255
Set : threshold:90000, temperature:85000, cdev:5(_fan_), curr_state:100, max_state:255
최종 생각 / 질문
- CPU 온도 임계 값을 설정할 수 있습니까?
- 전혀 설정되지 않았습니까? 아니면이 BIOS / 하드웨어와 관련이 있습니까?
- 하드웨어 (열 붙여 넣기)에 결함이있을 수 있습니까?
- 아니면 내가 완전히 잘못된 것을 분석 했습니까?
업데이트 # 1
이 주제에 대해 자세히 알아보고 인텔의 CPU 조절 및 다른 운영 체제 및 커널에서 동일하거나 약간 다른 문제에 직면 한 다른 게시물에 대한 몇 가지 기사를 읽은 후 랩톱이 제대로 작동하지 않는다는 결론에 도달했습니다. .
커널 메시지가 여전히 기괴하지만, 그 이유는 잘못된 커널 프린트 레벨 또는 그 밖의 것입니다. 또한 CPU 패키지 온도가 + 52.0 ° C이고 CPU 주파수가 1200MHz 일 때 이러한 메시지를 검색합니다. 이것은 전혀 의미가 없습니다.
스트레스 테스트를 통해 랩톱을 테스트 할 때 오류 메시지가 표시되지만 실제로 CPU는 조절되지 않습니다. 1 코어 만 테스트하면 3,900MHz의 최대 터보 부스트 속도를 얻습니다. 4 개의 코어를 모두 테스트하면 최대 주파수가 ~ 3,300MHz로 줄어 듭니다. 예상되는 동작 은 무엇입니까 ?
여기 누군가가 더 많은 내부 정보를 제공하지 않는 한이 문제를 제쳐 두겠습니다.
업데이트 # 2
시스템 업데이트 후 변경 사항이 없습니다 :
No LSB modules are available.
Distributor ID: Ubuntu
Description: Ubuntu 18.04 LTS
Release: 18.04
Codename: bionic
Linux4.15.0-20-generic #21-Ubuntu SMP Tue Apr 24 06:16:15 UTC 2018 x86_64 x86_64 x86_64 GNU/Linux
업데이트 # 3
시스템 업데이트 후 변경 사항이 없습니다 :
Distributor ID: Ubuntu
Description: Ubuntu 18.10
Release: 18.10
Codename: cosmic
Linux x1 4.18.0-13-generic #14-Ubuntu SMP Wed Dec 5 09:04:24 UTC 2018 x86_64 x86_64 x86_64 GNU/Linux
그래서 마지막 가정은 로그가 가짜 일 가능성이 높거나 로그 수준이 잘못 구성되었다는 것입니다. 랩탑이 제대로 작동하거나 조절되지 않기 때문에 과열되지도 않습니다.
그래도 누군가이 문제를 해결할 수있는 직감이 있다면 자유롭게 대답하십시오 :-)
업데이트 # 4
No LSB modules are available.
Distributor ID: Ubuntu
Description: Ubuntu 19.04
Release: 19.04
Codename: disco
Linux cw-x1 5.0.0-13-generic #14-Ubuntu SMP Mon Apr 15 14:59:14 UTC 2019 x86_64 x86_64 x86_64 GNU/Linux
여전히 임계 값 조절 메시지가 나타납니다.
업데이트 # 5
새로 설치 한 19.10과 동일한 결과 :
No LSB modules are available.
Distributor ID: Ubuntu
Description: Ubuntu 19.10
Release: 19.10
Codename: eoan
방금이 문제가 완전히 새로운 X1 Extreme 2nd Gen으로 해결되지 않았다는 게시물을 발견했습니다 .
내가 가지고있는 노트북을 구입할 생각을하는 다른 사람들을 위해 다음과 같은 몇 가지 문제가 있습니다.
- 터치 스크린이 제대로 작동하지 않습니다
- 지문이 작동하지 않습니다
- 최대 절전 모드는 때때로 성공
- 그래픽 문제로 인해 서로 다른 작업 환경 (사무실과 본사) 간 전환이 작동하지 않습니다.
- 일반적으로 다중 모니터와 관련된 많은 문제
- 사용 가능한 RAM이 충분하더라도 하드 드라이브 교체가 발생합니다
- kscreen und xrandr의 일반적인 및 다양한 문제
이제 항복하고 HP 나 Dell로 옮길 것입니다. ~ 2500 €의 랩톱의 경우 실제로 이러한 종류의 문제를 원하지 않습니다 :-(
업데이트 # 6
재미있는 사실 : 어제 인텔 코어 i9-9980HK가 장착 된 Dell Precision 5540을 받았습니다.
11.12.19 22:11 kernel mce: CPU9: Package temperature above threshold, cpu clock throttled (total events = 412597)
11.12.19 22:11 kernel mce: CPU5: Package temperature above threshold, cpu clock throttled (total events = 412165)
11.12.19 22:11 kernel mce: CPU13: Package temperature above threshold, cpu clock throttled (total events = 412647)
11.12.19 22:11 kernel mce: CPU1: Package temperature above threshold, cpu clock throttled (total events = 412648)
11.12.19 22:11 kernel mce: CPU15: Package temperature above threshold, cpu clock throttled (total events = 412378)
11.12.19 22:11 kernel mce: CPU7: Package temperature above threshold, cpu clock throttled (total events = 412669)
11.12.19 22:11 kernel mce: CPU0: Package temperature above threshold, cpu clock throttled (total events = 412669)
11.12.19 22:11 kernel mce: CPU8: Package temperature above threshold, cpu clock throttled (total events = 412625)
11.12.19 22:11 kernel mce: CPU11: Package temperature above threshold, cpu clock throttled (total events = 412668)
11.12.19 22:11 kernel mce: CPU4: Package temperature above threshold, cpu clock throttled (total events = 412102)
11.12.19 22:11 kernel mce: CPU2: Package temperature above threshold, cpu clock throttled (total events = 412669)
11.12.19 22:11 kernel mce: CPU6: Package temperature above threshold, cpu clock throttled (total events = 412669)
11.12.19 22:11 kernel mce: CPU3: Package temperature above threshold, cpu clock throttled (total events = 412208)
11.12.19 22:11 kernel mce: CPU14: Package temperature above threshold, cpu clock throttled (total events = 412661)
11.12.19 22:11 kernel mce: CPU12: Package temperature above threshold, cpu clock throttled (total events = 411001)
11.12.19 22:11 kernel mce: CPU10: Package temperature above threshold, cpu clock throttled (total events = 412663)
11.12.19 22:11 kernel mce: CPU9: Package temperature/speed normal
11.12.19 22:11 kernel mce: CPU5: Package temperature/speed normal
11.12.19 22:11 kernel mce: CPU2: Package temperature/speed normal
11.12.19 22:11 kernel mce: CPU15: Package temperature/speed normal
11.12.19 22:11 kernel mce: CPU1: Package temperature/speed normal
11.12.19 22:11 kernel mce: CPU10: Package temperature/speed normal
11.12.19 22:11 kernel mce: CPU7: Package temperature/speed normal
11.12.19 22:11 kernel mce: CPU13: Package temperature/speed normal
11.12.19 22:11 kernel mce: CPU8: Package temperature/speed normal
11.12.19 22:11 kernel mce: CPU11: Package temperature/speed normal
11.12.19 22:11 kernel mce: CPU0: Package temperature/speed normal
11.12.19 22:11 kernel mce: CPU4: Package temperature/speed normal
11.12.19 22:11 kernel mce: CPU3: Package temperature/speed normal
11.12.19 22:11 kernel mce: CPU12: Package temperature/speed normal
11.12.19 22:11 kernel mce: CPU14: Package temperature/speed normal
11.12.19 22:11 kernel mce: CPU6: Package temperature/speed normal
나는 지금 말문이없고 부족하다. 더 이상 내 로그를 확인하지 않을 것 같습니다 :-( 사건이 종결되었습니다.
tlp
구성 파일을 통해 조정할 수 있다고 생각 하지만 결코 변경하지 않았습니다. tlp
모든 과열 문제를 설치 한 후 사라졌습니다.