Cisco Nexus

N9K MCE Error

최찐찐멍 2023. 6. 16. 11:13
반응형

N9K를 사용하면서 아래의 Log가 지속적으로 나타난다면 아래의 사항을 확인해주세요.

[Problem Log]

%DEVICE_TEST-3-MCE_24HR_FAIL: Module 1 has exceeded MCE 24 hour correctable threshold of 100 with ##### correctable errors within 24 hours.

%DAEMON-3-SYSTEM_MSG: corrected Socket memory error count exceeded threshold: ####### in 24h - mcelog

[Check-Point]

DIMM 제조업체는 원하는 용량에 도달하기 위해 여러 메모리 모듈의 DIMM을 구성합니다. 이 경우 특정 모듈의 제조 편차가 16GB DIMM에 영향을 미칩니다. 이 편차는 특정 날짜 범위에 포함되었으며 이러한 칩을 사용하는 DIMM은 2020년 중반에서 말까지 제조되었습니다.

이 편차가 발견된 이후로 향후 DIMM에서 이러한 공정 편차가 발생하지 않도록 제조 공정에 추가 제한이 적용되었습니다.

FN72464: Some DIMMs failing at higher than expected rate

https://bst.cloudapps.cisco.com/bugsearch/bug/CSCwb98743

NXOS안에서 확인하는 방법은 아래와 같습니다.

# feature bash

# sudo su -

bash-4.3# dmidecode --type memory <<< 이 명령어의 결과를 Cisco TAC에게 전달하면 트러블슈팅을 할때 훨씬 빠릅니다.

 

반응형