전통문화대전망 - 전통 미덕 - 소프트웨어 공학 기술의 데이터 마이닝 응용에 관한 졸업 논문
소프트웨어 공학 기술의 데이터 마이닝 응용에 관한 졸업 논문
소프트웨어 공학 기술에서의 데이터 마이닝 응용에 관한 졸업 논문
Abstract 컴퓨터 기술이 발전함에 따라 소프트웨어는 점점 더 복잡해지고 시스템 개발 업무는 더욱 중요해진다. 정보기술의 광범위한 적용은 많은 양의 데이터를 생성하게 되며, 데이터를 마이닝하고 기존 패턴을 분석하는 것은 데이터 자원의 효과적인 활용에 큰 의미를 갖습니다. 이 기사에서는 소프트웨어 엔지니어링에 데이터 마이닝 기술을 적용하는 방법을 간략하게 설명합니다.
키워드 데이터 마이닝 기술, 소프트웨어 공학, 응용 소프트웨어 기술
정보기술의 발전과 함께 급속도로 발전하고 있지만 제어성은 그다지 높지 않습니다. 강한. 소프트웨어는 신청 과정에서 많은 양의 데이터를 생성합니다. 데이터는 귀중한 자원이며, 효과적으로 사용하면 부가가치를 얻을 수 있습니다. 소프트웨어 개발 산업으로서 데이터 마이닝 기술을 적용하면 규칙을 연구함으로써 소프트웨어 엔지니어링에 대한 해당 지침을 제공하고 시스템 오류를 효과적으로 처리하고 비용 평가의 효율성을 향상시킬 수 있습니다.
1 데이터 마이닝 기술 적용의 문제점
1.1 정보 데이터 자체의 복잡성
소프트웨어 엔지니어링에 포함된 데이터는 두 가지 범주로 나눌 수 있습니다. 구조화 대 비구조화. 소프트웨어 코드는 비정형 데이터에서 중요한 역할을 합니다. 구조화된 데이터에 영향을 미치는 것은 소프트웨어 버전 정보입니다. 구조화된 데이터와 구조화되지 않은 데이터 사이에는 밀접한 연관성이 있습니다. 데이터의 효과적인 활용을 위해서는 특정 기술을 통해 규칙을 찾아내는 것이 필요합니다. 데이터 마이닝 기술은 이러한 요구 사항을 충족합니다. 이 기술을 사용하면 정형 데이터와 비정형 데이터를 통합하여 사용 효율성을 높일 수 있습니다.
1.2 평가 기준의 일관성 부족
데이터 마이닝 기술은 생활에 널리 사용됩니다. 이 기술을 적용하면 실제 상황을 더 잘 평가하고 결과를 평가할 수 있습니다. 최적화. 그러나 통일된 표준이 없기 때문에 소프트웨어 정보가 복잡해집니다. 그리고 표현방식에도 차이가 있습니다. 정보 취득자는 정보를 효과적으로 적용하고 비교할 수 없습니다. 정보에 대한 통일된 기준이 부족한 이유는 평가 방식이 일관되지 않기 때문이다.
2 소프트웨어 공학에 데이터 마이닝 기술 적용
2.1 데이터 마이닝 실행 기록
실행 기록 마이닝은 주로 메인 프로그램의 경로를 분석하는 것이므로 프로그램 코드에 존재하는 상관관계를 발견하는 것입니다. 핵심은 관련 실행 경로를 분석하고 역모델링을 수행하여 궁극적으로 목표를 달성하는 것입니다. 역할은 프로그램을 검증하고, 유지하고, 이해하는 것입니다. 레코드 마이닝 프로세스는 일반적으로 분석 대상 시스템의 예비 계측, 이전 단계 실행 후 응용 프로그래밍 인터페이스, 시스템 및 모듈의 상태 변수를 기록하고 최종적으로 얻은 정보를 기록하는 기록 프로세스로 구성됩니다. 축소, 필터링 및 클러스터링. 결과 모델은 시스템의 특성을 표현할 수 있습니다.
2.2 취약점 탐지
시스템이나 소프트웨어 자체에는 허점이 있을 것이며 허점 자체에는 어느 정도 은폐되는 부분이 있습니다. 왜냐하면 인간의 사고에는 특정 맹점이 있기 때문입니다. 허점을 발견할 수 없으므로 일부 소프트웨어가 필요합니다. 취약점 탐지의 목적은 소프트웨어의 허점과 오류를 찾아내고 이를 복구하여 소프트웨어의 품질과 보안을 보장하는 것입니다. 데이터 마이닝 기술을 소프트웨어 테스팅에 적용하려면 먼저 테스트 항목을 결정하고, 사용자 요구에 따라 테스트 내용을 계획하고, 테스트 방법을 결정하고, 구체적인 계획을 수립해야 합니다. 테스트 프로세스는 주로 데이터 정리 및 변환 작업으로, 수집된 취약점 데이터를 기반으로 소프트웨어 데이터와 관련되어 결함이 있는 데이터를 필터링하고, 데이터가 없는 나머지 데이터를 필터링합니다. 누락된 항목을 보완하기 위한 적절한 조치를 취하고 해당 속성을 수치 표현으로 변환합니다. 다음 단계는 훈련 및 검증을 위한 적절한 모델을 선택하는 것입니다. 이 링크는 프로젝트의 실제 요구 사항과 결합하여 마이닝 방법을 선택하고 다양한 데이터 결과를 분석하고 비교하여 가장 적합한 방법을 찾아야 합니다. 이후, 위의 방법을 반복적으로 적용하여 소프트웨어의 취약점을 찾아 탐지합니다. 그리고 소프트웨어 라이브러리에서 해당 데이터를 수집하고 취약점 설명에 따라 분류한 후 최종적으로 마이닝을 통해 얻은 지식을 테스트된 프로젝트에 적용합니다.
2.3 오픈 소스 소프트웨어
오픈소스 소프트웨어의 개방성, 역동성 및 글로벌 특성으로 인해 오픈소스 소프트웨어의 관리는 기존 관리 소프트웨어와 다르게 취급되어야 합니다. 일반적으로 성숙한 오픈소스 소프트웨어는 소프트웨어 애플리케이션에 대한 비교적 완전한 기록을 보유하고 있으며 참여 내용에는 오류가 포함됩니다. , 개발자 활동을 보고합니다. 개발에 참여하는 직원은 역동적인 변화의 한가운데에 있을 것입니다. 역동적인 변화가 존재하는 이유는 소프트웨어의 개방성에 있습니다. 동시에 소프트웨어의 동적 기능을 마이닝하면 오픈 소스 소프트웨어의 고품질 관리 목표를 달성할 수 있습니다.
2.4 버전 관리 정보
프로젝트 담당자의 편집 내용의 통일성을 보장하기 위해서는 시스템 적용에 대한 관리가 필요합니다. 소프트웨어 개발 엔지니어링 애플리케이션에서 개발 작업 관리 및 보호는 버전 제어 시스템을 통해 구현됩니다.
그리고 그 적용 방법은 주로 변경 데이터를 마이닝하고, 서로 다른 모듈과 시스템 간의 관계를 찾아내고, 프로그램에서 발생할 수 있는 취약점을 탐지하는 것입니다. 이러한 종류의 기술을 적용하면 시스템의 이후 유지 관리 비용을 효과적으로 줄일 수 있으며 이후 변경으로 인해 발생하는 허점도 피할 수 있습니다.
3 소프트웨어 엔지니어링에 데이터 마이닝 적용
3.1 상관 방법
이 방법은 데이터에서 관련 연관성과 흥미로운 연관성을 찾는 데 사용됩니다. 구체화된 연관 규칙에는 두 가지 분명한 특성이 있습니다. ①지원; ②신뢰성. 전자는 특정 사물 집합에서 두 하위 집합이 발생할 확률이 동일하다는 것을 의미합니다. 후자는 일련의 사물에 포함된 항목이 다른 항목에도 나타날 확률을 보여줍니다.
3.2 분류 방법
이 방법은 주로 분류 레이블 및 이산값의 연산에 적용됩니다. 이 방법의 단계는 먼저 해당 모델을 설정하고 데이터를 설명하고 모델을 사용하여 분류하는 것입니다. 분류 방법 선택에 있어서 일반적으로 사용되는 방법에는 의사결정 트리 방법, 베이지안 방법, 지원 용어 기계 방법 등이 있습니다. 의사결정 트리 방법의 적용 기반은 탐욕 알고리즘입니다.
3.3 클러스터링 방법
일반적으로 사용되는 방법에는 분할 방법, 밀도, 모델, 그리드 기반 방법 및 계층적 방법이 있습니다. 군집분석의 입력은 순서쌍의 집합이며, 순서쌍의 데이터는 각각 표본과 유사성을 나타냅니다. 기본 응용 이론은 다양한 객체 데이터를 기반으로 적용하는 것입니다.
4 소프트웨어 엔지니어링에 데이터 마이닝 적용
4.1 복제 코드의 데이터 마이닝
소프트웨어 엔지니어링에서 가장 원시적인 것은 복제 코드 테스트를 검사하는 것입니다. 접근 방식은 텍스트 비교와 식별자 비교를 기반으로 합니다. 전자는 판단을 내리기 위해 시스템의 프로그램 코드에 포함된 명령문을 사용합니다. 이 방법의 이후 개선 과정에서는 문자열 매칭 효율을 높이는 것이 주요 목적이다. 실제 신청과정에서는 상관함수 매칭을 통해 효율성을 최적화합니다.
4.2 소프트웨어 데이터 검색 및 마이닝
이 방법은 소프트웨어 엔지니어링의 원래 마이닝 요구 사항 중 하나이기도 합니다. 이 방법은 주로 다음과 같은 3단계의 적용을 거친다.
①데이터 입력. 그 본질은 검색해야 할 정보를 입력하고 이를 사용자의 요구와 결합하여 데이터에서 사용자가 필요로 하는 데이터를 찾는 것입니다.
②정보 검색 과정. 시스템은 사용자가 찾아야 할 정보를 확인한 후 정보 내용에 따라 데이터베이스를 검색하고 분류합니다.
③정보 데이터를 내보내고 봅니다. 사용자는 필요에 따라 데이터를 내보내거나 온라인으로 볼 수 있습니다. 데이터를 내보낼 때 해당 기록이 형성되므로 고객이 다시 검색하는 것이 더욱 편리하고 빨라집니다. 데이터를 내보내려면 관련 소프트웨어를 사용해야 합니다.
4.3 설계에 적용되는 3단계
소프트웨어 엔지니어링에는 소프트웨어에 관한 많은 정보가 있으며, 그 정보는 대개 코드 베이스에 저장됩니다. 데이터를 활용하면 업무 효율성이 향상될 수 있습니다. 소프트웨어 엔지니어링의 모든 주기에서는 많은 양의 데이터가 생성됩니다. 소프트웨어 엔지니어링 수명주기를 기준으로 분석 및 설계, 반복 개발, 유지 관리 및 적용의 세 단계로 나눌 수 있습니다.
4.4 프로젝트 관리 데이터 세트 마이닝
지금까지 소프트웨어 개발 작업은 여러 분야를 하나로 통합했습니다. 경제, 조직행동, 경영 등 소프트웨어 개발자의 경우 기술 혁신뿐만 아니라 과학적이고 표준화된 관리에도 중점을 두고 있습니다. 버전 관리 정보 마이닝 외에도 인사 조직 관계 마이닝도 있습니다. 대규모 소프트웨어 개발 작업에 있어 인력의 효과적인 배치와 조정 역시 소프트웨어 작업 분야에서 직면해야 할 문제이다. 예를 들어, 대규모 시스템의 개발 과정에는 많은 사람이 참여하는 경우가 많고, 이들 간의 커뮤니케이션이 이루어져야 합니다. 의사소통 방법에는 대면소통, 문서이송, 전자정보 등이 있습니다. 인력 간의 관계를 탐구함으로써 경영 업무 발전에 도움이 됩니다. 직원 그룹이 존재하는 네트워크는 소셜 네트워크입니다. 합리적인 조직과 인력 배치를 통해 프로젝트 일정, 비용 및 성공 가능성에 영향을 미칩니다. 이 분야의 구현 연구에서는 일반적으로 시뮬레이션 모델링을 사용합니다.
5 결론
소프트웨어 공학 기술은 기술의 발전 중 하나로 그 중요성과 역할이 점점 더 커지고 있다. 더 분명합니다. 굴착 기술의 신뢰성과 효율성을 보장하기 위해 다른 엔지니어링 기술과 특정 통합이 있습니다. 데이터 마이닝은 실제 적용에서 막대한 경제적 이익을 보여왔으므로 그 적용 범위를 적극적으로 장려하고 적용의 깊이와 수준을 확대해야 합니다.
참고자료
[1]소프트웨어 공학에서의 데이터 마이닝 기술 적용에 대한 검토[J], 2016(34). >
[2] Lei Lei. 소프트웨어 엔지니어링에서 데이터 마이닝 기술 적용에 대한 검토 [J], 2014(02) Sun Yunpeng. 소프트웨어 엔지니어링 응용 분야 검토 [J], 2015(15).