동일 환경에서 증상 재현 확인함 : 서버<->스위치간 장비 연결 → 4Port 10Gb NIC 2장을 활용한 Bond구성에서도 drop이 발생하고,
Onboard인 eno1에서도 drop이 발생함.
: single network port에서도 발생되어 bonding구성 오류라고 볼 수 없음.
동일 서버(supermicro 740GP-TNRT) eno1(Onboard)<-> Cisco 2960(검증을 위한 임시 스위치 입고하여 테스트함.)
연결시에도 지속적으로 Rx drop현상 발생
기존 서버(DELL R740 : CGR81D3) eno1(Onboard) ↔ 위 신규 스위치(NETGEAR XS728T)간 검증시 drop 발생 안 함.
기존 서버(DELL R740 : CGR81D3) eno1(Onboard) ↔ Cisco 2960(검증을 위한 임시 스위치 입고하여 테스트함.) 스위치간 검증시 drop 발생 안 함.
** 서버노드를 제외한 모든 동일한 네트워크 환경에서 검증 테스트시 Rx drop현상이 SuperMicro Server에서만 발생함을 확인함.
위 고객사에 총 supermicro 740GP-TNRT 9대 서버가 모두 일관되게 Rx drop이 발생합니다.
- 동일한 H/W에 Redhat7.x, CentOS7.x 설치시 Rx drop은 발생하지 않습니다.
이에 우분투와 해당 서버(intel NIC)간 이슈로 좁혀지는데 이 이슈를 해결할 수 있는 방법을 알고 계시면 공유좀 부탁 드립니다.
저는 잘 모르는 분야여서 전혀 감이 없었는데 읽으면서 잘 배웠습니다.
앞 분이 얘기 하신듯 저 역시 드라이버 보다는 리눅스 커널 버전이랑 연관이 있거나 혹시 사용하는 앱이 업그레이드 되면서 버그가 있는건가 라는 생각이네요.
ubuntu mainline 같은거로 커널을 바꿔서나 아니면 호스트의 메모리를 늘리면 나아지지 않을까 생각합니다.
ubuntu-bug linux 명령 실행하면, 커널 관련 버그 리포트에 필요한 시스템 정보가 자동 수집 된다고 하네요. 제가 실행 해 보니, 자동으로 팝업 창 열려서 시스템 정보가 수집 되고. 수집 완료된 후에 보내기 버튼 누르면 Launchpad 에서 자동으로 버그 제출 화면이 열려서 생성된 파일이 첨부 됩니다.
The submitter should provide as much information as possible in the bug description:
The majority of kernel bug are hardware specific so be sure to note what hardware/device is being used.
Document any known steps to reproduce the bug.
Also note whether the bug exists in previous kernel versions of Ubuntu or if it’s a regression from previous kernel versions.
Finally, it’s critical to also make sure to test the latest development Ubuntu kernel version as well as the latest upstream mainline kernel.
버그 설명에는 아래와 같은 설명을 가능한 자세히 알려 달라고 하는군요. 위에서 언급 하셨던 내용도 같이 넣어 주시면 될거 같아요.
대부분의 커널 버그가 특정 하드웨어 관련 버그이므로, 사용된 하드웨어나 장치 정보 필요
버그 재현 방법 설명
우분투의 이전 커널 버전에서도 같은 버그가 있었는지, 이전 커널 버전에서 regression (보안 패치로 인해 발생한 또 다른 버그 등)이 있었는지 정보
마지막으로, 매우 중요한 이슈라면, 최신 우분투 개발 버전 커널이나 업스트림 메인라인 커널로 테스트 해 보았는지 여부.